AI 技術動向

AI 技術動向

オープンソースTTS神話ChatTTS:使用チュートリアルと開発ガイド

人工知能が常に進歩する今日、テキストトゥースピーチ(TTS)技術は、人と機械の間の対話体験を向上させる重要なツールとなっています。今日は、対話シナリオに最適化されたオープンソースTTSプロジェクトであるChatTTSについて探求していきまし...
AI 技術動向

Whisperを解読する:AIが駆動する音声認識の新しい時代

人工知能の世界では、音声認識技術は常に人間の言葉と機械の理解を結ぶ重要な架け橋となっています。今日は、OpenAIが開発した革新的な自動音声認識(ASR)モデルであるWhisperについて探求していきましょう。これは単なるモデルではなく、複...
AI 技術動向

音声認識システム Reverb ASR

こんにちは!今日は「Reverb ASR」という面白いシステムについてお話ししたいと思います。じゃあ、みんな、リラックスして聞いてね。まず、ASRってなんだろう?ASRは「Automatic Speech Recognition」の略で、日...
AI 技術動向

SenseVoice多言語音声理解モデル – small

SenseVoiceは高精度の多言語音声認識、感情認識、および音響イベント検出に特化しています。多言語認識:40万時間以上のデータで訓練され、50以上の言語をサポートし、Whisperモデルを上回る認識効果を実現しています。富文本認識:優れ...
AI 技術動向

SeACoParaformer ホットワード音声認識 – 中国語 – 汎用 – 16kHz – オフライン – large

Paraformer-largeモデルの紹介ハイライトParaformer-largeホットワード版モデルはホットワードカスタマイズ機能をサポートしています:ホットワードリストに基づいてインセンティブを強化し、ホットワードのリコール率と正確...
AI 技術動向

PLUG 事前トレーニング生成モデル-中国語-27B

大規模な中国語理解と生成の共同モデル PLUGPLUG (言語理解と生成のための事前トレーニング) は、中国語の理解と生成のための 270 億パラメータの大規模な共同事前トレーニング モデルです。モデルの説明PLUG は、大量の高品質の中国...
AI 技術動向

GPT-MoE中国語13億広告コピー生成

GPTモデルはテキスト生成分野の各種タスクを比較的に良く処理することができます。例えば、テキスト補完、フリーQ&A、完形填空、作文、要約、小説、詩などがあります。最近インターネット全体で人気のある人工知能製品のChatGPTもGPTテキスト...
AI 技術動向

GPT-3の预售訓練生成モデル – 中国語 – 13B

タイトル:GPT-3中国語13Bパラメーター量テキスト生成モデルモデルの説明GPT-3モデルは、一般的な预售訓練生成モデルで、TransformerのDecoder-only構造を使用しています。これにより、ダウンストリームの様々な生成タス...
AI 技術動向

GPT-3の预售訓練生成モデル – 中国語 – large

タイトル:GPT-3テキスト生成モデルの紹介モデルの説明GPT-3モデルは、一般的な预售訓練生成モデルで、TransformerのDecoder-only構造を使用しています。これはダウンストリームの様々な生成タスク、特にzero-shot...
AI 技術動向

PALM 2.0 预售訓練生成モデル – 中国語 – base

PALMテキスト生成モデルの紹介PALMモデルは汎用的な预售訓練生成モデルであり、各種のダウンストリーム生成タスクに対応することができます。モデルは大量の無標識データを用い、自己エンコーディングと自己リカレント任務を組み合わせた预售訓練を行...