AI 技術動向

DeepSeek:AI 領域における革新的な技術革新

現代の急速に発展する AI 領域で、DeepSeek はその卓越した技術革新により際立っており、人工知能の発展に新たな可能性と方向性をもたらしています。以下では、DeepSeek の一連の技術革新について詳しく紹介します。これらの革新は、モ...
AI 技術動向

CosyVoice 2.0-0.5B:音声生成大規模モデルの革新と応用

人工知能分野において、音声生成技術は常に研究の焦点の一つです。ディープラーニング技術の発展に伴い、音声生成モデルのパフォーマンスと応用範囲は不断扩大しています。CosyVoice 2.0-0.5B は、ModelScope.cn が提供する...
AI 技術動向

dolphin AIの音声転換ツール:効率的なオフィスワークを実現する

dolphin AIの音声転換ツールとはdolphin AIの音声転換ツールは、音声を迅速かつ正確にテキストに変換するAI技術を搭載したツールです。このツールは、オフィス環境における効率性と生産性の向上に焦点を当てており、以下のような機能を...
AI 技術動向

Dolphin AIの音声認識技術とその活用方法

Dolphin AI音声認識システムとはDolphin AIの音声認識システムは、音声オーディオを対応する言語のテキストに変換する高度な技術です。このシステムはエンドツーエンドのフレームワークを採用し、中国語、英語、日本語、フランス語、スペ...
AI 技術動向

Dolphin AI:効率的な「文字起こし」を実現する強力なツール

現代社会において、音声や動画コンテンツがますます豊富になる中で、「文字起こし」(音声や動画を文字に変換する作業)は多くの業界で必須のスキルとなっています。会議記録、ポッドキャスト制作、動画字幕の生成、コンテンツ制作など、音声を高速かつ正確に...
AI 技術動向

Geminiを使用して音声と動画をワンクリックでSRT字幕に変換する方法:無料で強力な音声認識ツール

現代のデジタル時代において、音声や動画の作成と共有はますます一般的になっています。動画チュートリアルを制作したり、会議の記録をアップロードしたり、もしくは個人メディアのコンテンツを作成する場合など、音声や動画に字幕を追加することで、コンテン...
AI 技術動向

音声認識技術(STT)入門:基本原理と幅広い用途

現代社会において、音声認識技術(Speech-to-Text, STT)は私たちの生活やビジネスに深く浸透し、劇的な変化をもたらしています。スマートフォンの音声アシスタント、会議の自動記録、スマートスピーカー、そしてカスタマーサービスセンタ...
AI 技術動向

音声認識技術(ASR)とは:基本原理と実現プロセスを理解する

現代のデジタル時代において、音声認識技術(ASR:Automatic Speech Recognition)は私たちの生活のあらゆる場面に浸透しています。スマートフォンの音声アシスタント(例えば、AppleのSiriやAndroidの音声ア...
AI 技術動向

Paraformer:中国語音声認識の新しい時代を開く

デジタル時代の波に乗り、音声認識技術は私たちの生活において欠かせない存在となっています。スマートスピーカーや会議記録ツールなど、音声認識の应用场景はますます広がっています。今回は、多人数の対話シーンに特化した強力な中国語音声認識モデル、Pa...
メディア

【多言語音声認識API – DolphinVoice】 が 【株式会社ホープラン東京】様の自律走行型サービスロボットに採用されました!

【株式会社DolphinAI】(本社: 、代表取締役: )は、この度、『DolphinVoice音声対話サービス』が2025年2月10日より【株式会社ホープラン東京】(本社: 、代表取締役: )のサービスロボットに正式に採用されたことをお知...