Dolphin Voice
  • プロダクト
  • 価格
  • リソース
    • 会社概要
    • ドキュメント
  • メディア
  • お問い合わせ

音声認識(ASR)

AI 技術動向

Step-Audio:音声とテキストの統一理解と生成、マルチモーダル時代の幕開け

2025年、AI音声技術は新たな突破を遂げました。Step-Audioは、音声とテキストの統一理解と生成を実現した世界初のオープンソースの音声フレームワークです。リアルタイム音声アシスタントから複雑なタスクの動的制御まで、Step-Audi...
2025-04-10
AI 技術動向

新着記事

  • BAGEL-7B-MoT:多モーダル処理の新たなブレイクスルー 2025 年 6 月 13 日
  • OuteTTS-1.0-0.6B:音声合成の新時代を開く 2025 年 6 月 13 日
  • CosyVoice 語音生成大モデル 2.0:音声合成の新時代を切り開く 2025 年 6 月 12 日
  • パラフォーマーを基にした中国語の音声認識 2025 年 6 月 10 日
  • Whisper-Large 多言語認識モデル:言語の壁を超える音声理解ツール 2025 年 6 月 9 日

カテゴリー

  • AI 技術動向
  • サ一ビスリリ一ス
  • ニュース
  • メディア
LinkedIn 公式ページ Facebook 公式ページ X(Twitter)/お楽しみに
ISO 27001
SOC 2
SSL/TLS
GDPR
APPI
LinkedIn 公式ページ Facebook 公式ページ X(Twitter)/お楽しみに
Dolphin Voice
Copyright © 2023-2025 DolphinAI K.K. All Rights Reserved.
    • プロダクト
    • 価格
    • リソース
      • 会社概要
      • ドキュメント
    • メディア
    • お問い合わせ
  • Dolphin Voice
  • ホーム