AI 技術動向

BAGEL-7B-MoT：多モーダル処理の新たなブレイクスルー

今日、人工知能分野において、多モーダル処理技術が徐々に研究のホットスポットとなっています。多モーダルモデルは、テキスト、画像、オーディオなど、多种類のデータを同时に処理でき、従来の単一モーダルモデルの限界を打破します。これにより、実际の问题...

2025-06-13

AI 技術動向

今日、人工知能技術の急速な発展に伴い、音声合成技術は人間と機械のインターフェースとして、我们的生活と仕方を前所没有のスピードで革新しています。スマートフォンの音声アシスタントからオーディオブック、ラジオドラマ、バーチャルYouTuberに至...

2025-06-13

AI 技術動向

デジタル時代において、音声技術の応用範はますます広がりを見せています。スマートフォンの音声アシスタント、オーディオブック、ラジオドラマ、バーチャルYouTuberなど、高品質な音声生成技術は、ユーザー体験の向上とコンテンツ制作効率の鍵となっ...

2025-06-12

AI 技術動向

この記事では、ダモアilionの音声チームが開発した Paraformer という効率的な中国語の音声認識モデルを紹介します。これは高い精度と計算効率を備えており、多种の音声認識シーンに适用できます。以下にこのモデルの詳細な紹介を示します。...

2025-06-10

AI 技術動向

グローバル化が進むデジタル社会において、音声認識技術は言語の壁を取り払い、効率的なコミュニケーションを実現する鍵となっています。本記事では、音声認識分野に新的なブレークスルーをもたらした強力な多言語認識モデル「Whisper-Large 多...

2025-06-09

AI 技術動向

現在、人工知能分野において、大型言語モデル（LLMs）の応用がますます広がっています。しかし、ほとんどのモデルは、エッジデバイス上でのデプロイにあたり、効率や性能の課題に直面しています。このような課題を解決するために、OpenBMB チーム...

2025-06-09

AI 技術動向

自然言語処理（NLP）分野では、技術の急速な発展が私たちと機械とのインタラクションの方法を絶えず変革しています。ModelScope プラットフォーム上の革新的なモデルである DeepSeek-R1-0528 が、その独特な能力でますます多...

2025-06-06

AI 技術動向

自然言語処理（NLP）分野で、プレトレーニングモデルのアプリケーションは技術の発展を极大地推進しています。中国語処理に専門化したプレトレーニングモデルであるStructBERTは、その独特なトレーニング方法と言語構造への深いモデル化により、...

2025-06-06

AI 技術動向

現在の人工知能分野では、大規模言語モデルの急速な発展が私たちとテクノロジーとのインタラクションの方法を劇的に変えていくにつれ、スマートなチャットボタからテキストコンテンツ创建工作まで、大規模言語モデルの应用场景は絶えず広がっています。本日は...

2025-06-04

AI 技術動向

DeepSeek R1 と V3 の位置づけとコアな能力DeepSeek V3 は、テキスト、画像、音声、動画など多種多様な形式を処理するマルチモーダルモデルです。自然言語処理の幅広いシナリオに活用可能です。例えば、スマートカスタマーサービ...

2025-05-16

AI 技術動向