音声認識 | ページ 7 | Dolphin Voice Blog

SenseVoice多言語音声理解モデル – small

SenseVoiceは高精度の多言語音声認識、感情認識、および音響イベント検出に特化しています。多言語認識：40万時間以上のデータで訓練され、50以上の言語をサポートし、Whisperモデルを上回る認識効果を実現しています。富文本認識：優れ...

2024-09-24

AI 技術動向

Paraformer-largeモデルの紹介ハイライトParaformer-largeホットワード版モデルはホットワードカスタマイズ機能をサポートしています：ホットワードリストに基づいてインセンティブを強化し、ホットワードのリコール率と正確...

2024-09-24

AI 技術動向

PALMテキスト生成モデルの紹介PALMモデルは汎用的な预售訓練生成モデルであり、各種のダウンストリーム生成タスクに対応することができます。モデルは大量の無標識データを用い、自己エンコーディングと自己リカレント任務を組み合わせた预售訓練を行...

2024-09-24

AI 技術動向

ASRとは何かASR（Automatic Speech Recognition）とは、人間の音声をテキストに変換する技術です。概念はシンプルですが、実際のアルゴリズムは比較的複雑で、実用化するとなるとさらに複雑になります。ASRの評価指標は...

2024-09-24

AI 技術動向

ASRとは何かASR（Automatic Speech Recognition）とは、人間の音声をテキストに変換する技術です。概念はシンプルですが、実際のアルゴリズムは比較的複雑で、実用化するとなるとさらに複雑になります。ASRの評価指標は...

2024-09-24

AI 技術動向

音声認識技術は急速に発展しており、正確さがソフトウェア性能を測る重要な指標となっています。リアルタイムの会議記録からスマートアシスタントまで、正確な音声認識はユーザー体験を向上させるため欠かせないです。この記事では、Dolphin Voic...

2024-08-23

AI 技術動向

自動化と人工知能の波に乘り、音声認識APIは企業や開発者が効率を向上させるための強力なツールとなっています。この記事では、トップクラスの5つの音声認識APIについて深く掘り下げ、異なるシナリオでのニーズにどのように応えることができるかを評価...

2024-07-26

AI 技術動向