ライブ文字化の使用

ライブ・トランスクリプション・ジョブを作成および管理する方法について学習します。

OCI Live Transcribeは、リアルタイムのトランスクリプションを提供します。これは、オーディオストリームを送信し、テキスト結果をリアルタイムで受信できる新機能です。リアルタイムの転写は、ヘルスケア、コールセンター、メディアなど、さまざまな業界の多くのユースケースに必要です。たとえば、医師や看護師は、リアルタイムの能力を必要とし、作業効率を向上させる医療命令を使用しています。OCI Live Transcribeのリリースにより、お客様はアプリケーションの正確なトランスクリプションを数秒以内に取得できます。埋込みテキスト・ウィンドウを使用してLive Transcribeを試すか、OCIリアルタイム・トランスクリプション・サービスとプログラム的に統合する方法に関するAPIドキュメントを参照できます。

Live Transcribeジョブの作成

ライブ・オーディオ・ストリームをテキストに変換するSpeechライブ・トランスクリプト・ジョブを作成して送信します。

  1. ナビゲーション・メニューを開き、「アナリティクスとAI」をクリックします。「AIサービス」で、「音声」をクリックします。
  2. 「リスト範囲」で、作業するコンパートメントを選択します。
  3. 左側のナビゲーション・メニューで、「ライブ・トランスクリプション」をクリックします。
  4. (オプション)トランスクリプションをカスタマイズするには、「カスタマイズの構成」セクションから次を選択します:
    • 言語の選択: これは、翻訳する言語です。ドロップダウン・リストから、翻訳する言語を選択します。
    • 部分サイレントしきい値: これは、音声認識を終了する前に、サービスが音声アクティビティの検出を停止した後、追加の音声を待機する時間(ミリ秒)です。ドロップダウン・リストから選択します。
    • 最終サイレントしきい値: これは、単語が話された後、セッションの終了を示すミリ秒単位の黙秘時間です。ドロップダウン・リストから選択します。
    • カスタマイズの有効化: セッションをカスタマイズするには、これを選択します。
  5. セッションを開始するには、「セッションの開始」をクリックし、話し始めます。
  6. セッションを停止するには、会話を停止してから「セッションの停止」をクリックします。
  7. (オプション)JSONファイルを表示するには、「JSONの表示」をクリックします。
  8. (オプション)セッションをリセットするには、「リセット」をクリックします。