話者識別機能

MiiTel Speech API には、AI による話者識別機能があります。本機能では、モノラル音声 (1 チャンネル) で録音された音声ファイルから、AI が話者を特定して文字起こしします。

本機能の利用方法は、ジョブの登録方法をご確認ください。

なお、本機能で話者識別された結果は JSON 上でのみ確認できます。

モノラル音声の解析

モノラル音声で、2 名以上の音声が 1 チャンネルで録音されているため、AI による話者識別機能を利用できます

ステレオ音声の解析

ステレオ音声において録音が 2 チャンネルで行われ、各チャンネルのそれぞれに音声が録音されている場合、AI による話者識別機能を利用する必要はありません

この記事は役に立ちましたか?