人们对大型语言模型有两种不同的期待。第一个期待是,我们期待大型语言模型成为解决某一种问题的专材,它可以解决某一种自然语言处理的特定任务。举例来说,我们把大型语言模型做一些调整以后,叫他专门做翻译,你给他什么句子,他都把中文翻成英文,我给他一个句子,他专门给他一段文章,他专门做摘要,看到一段文章作为输入,他就是会把文章变短,这个是让大型语言模型变成专才。那第二个期待是期待大型语言模型变成一个通才,变得无所不能,什么都会
举例来说,你给他一个句子以后,那他因为什么都会。所以如果你只给他一个句子,他不知道他要得到什么样的输出。所以你需要对他用人类可以看得懂的语言直接下指令。你告诉大型语言模型说现在把这句话做翻译,期待它就产生英文的句子。同样的句子,如果你下不同的指令说要做摘要,它就把你输入的文字进行摘要。而这个额外所下的用人类语言来描述的指令,期待今天机器可以看得懂人下的指令。
SpeechflowのASR APIは、以下のような優れた精度で文字起こしを行います。 14言語と、そのリストは増え続けています。このため、SpeechFlowは音声をテキストに変換したり、音声をテキストに変換したりするための理想的なソリューションとなっています。
AIモデルにより、音声は適切な句読点を含むテキストに変換され、読解に最適化されるため、理解しやすく、行動しやすいトランスクリプトになります。
シンプルなAPI設計により、SpeechFlowの導入は手間をかけずに行うことができます。クラウドとオンプレミスの両方をサポートし、セキュリティ、信頼性、柔軟性を確保します。
SpeechFlowは、最大1時間の音声ファイルを3分以内に処理できるため、正確でタイムリーなテープ起こしサービスを必要とする企業や個人にとって、非常に効率的なソリューションとなります。
1秒あたり $0.0002 の従量課金です。使用量と支払額を完全にコントロールし、透明性を確保できます。
まず、API KEY IDとAPI KEY SECRETを以下のコードにコピーしてください。ターミナルでこのコードを実行すると、すぐにtaskIdが返されます。
# for remote file API_KEY_ID="YOUR_API_KEY_ID" API_KEY_SECRET="YOUR_API_KEY_SECRET" # See more lang code: https://docs.speechflow.io/#/?id=ap-lang-list LANG="en" FILE_REMOTE_PATH="https://sf-docs-prod.s3.us-west-1.amazonaws.com/web/sample-audios/EN.wav" curl -H "keyId:${API_KEY_ID}" -H "keySecret:${API_KEY_SECRET}" -X POST -d "lang=${LANG}&remotePath=${FILE_REMOTE_PATH}" \ "https://api.speechflow.io/asr/file/v1/create"
# for local file API_KEY_ID="YOUR_API_KEY_ID" API_KEY_SECRET="YOUR_API_KEY_SECRET" # See more lang code: https://docs.speechflow.io/#/?id=ap-lang-list LANG="en" FILE_LOCAL_PATH="YOUR_FILE_LOCAL_PATH" curl -H "keyId:${API_KEY_ID}" -H "keySecret:${API_KEY_SECRET}" -F "file=@${FILE_LOCAL_PATH}" \ -X POST "https://api.speechflow.io/asr/file/v1/create?lang=${LANG}"
セカンド、taskIdを以下のコードにコピーしてください。このコードをターミナルで実行すると、転写結果が返されます。
API_KEY_ID="YOUR_API_KEY_ID" API_KEY_SECRET="YOUR_API_KEY_SECRET" TASK_ID="THE_TASKID_RETURNED_IN_THE_FIRST_STEP" curl -H "keyId:${API_KEY_ID}" -H "keySecret:${API_KEY_SECRET}" \ "https://api.speechflow.io/asr/file/v1/query?taskId=${TASK_ID}"