人们对大型语言模型有两种不同的期待。第一个期待是,我们期待大型语言模型成为解决某一种问题的专材,它可以解决某一种自然语言处理的特定任务。举例来说,我们把大型语言模型做一些调整以后,叫他专门做翻译,你给他什么句子,他都把中文翻成英文,我给他一个句子,他专门给他一段文章,他专门做摘要,看到一段文章作为输入,他就是会把文章变短,这个是让大型语言模型变成专才。那第二个期待是期待大型语言模型变成一个通才,变得无所不能,什么都会
举例来说,你给他一个句子以后,那他因为什么都会。所以如果你只给他一个句子,他不知道他要得到什么样的输出。所以你需要对他用人类可以看得懂的语言直接下指令。你告诉大型语言模型说现在把这句话做翻译,期待它就产生英文的句子。同样的句子,如果你下不同的指令说要做摘要,它就把你输入的文字进行摘要。而这个额外所下的用人类语言来描述的指令,期待今天机器可以看得懂人下的指令。
Speechflow의 ASR API는 다음 언어에서 최고의 정확도로 트랜스크립션합니다. 14 언어를 최고의 정확도로 전사하며 그 목록은 계속 늘어나고 있습니다. 따라서 SpeechFlow는 오디오를 텍스트로, 음성을 텍스트로 번역하는 데 이상적인 솔루션입니다.
AI 모델을 사용하여 오디오를 적절한 구두점이 있는 텍스트로 변환하고 읽기에 최적화하여 이해하기 쉽고 행동에 옮기기 쉬운 필사본을 생성합니다.
간단한 API 설계로 번거로움 없이 SpeechFlow를 배포할 수 있습니다. 보안, 안정성, 유연성을 보장하기 위해 클라우드 및 온프레미스 배포를 모두 지원합니다.
SpeechFlow는 최대 1시간 분량의 오디오 파일을 3분 이내에 처리할 수 있어 정확하고 시기적절한 트랜스크립션 서비스를 필요로 하는 기업과 개인에게 매우 효율적인 솔루션입니다.
초당 $0.0002 로 청구됨. 귀하는 사용량과 결제 금액을 완전히 제어하고 파악할 수 있습니다.
먼저, 다음 코드에 API 키 ID와 API 키 시크릿을 복사합니다. 터미널에서 코드를 실행하면 곧 taskId가 반환됩니다.
# for remote file API_KEY_ID="YOUR_API_KEY_ID" API_KEY_SECRET="YOUR_API_KEY_SECRET" # See more lang code: https://docs.speechflow.io/#/?id=ap-lang-list LANG="en" FILE_REMOTE_PATH="https://sf-docs-prod.s3.us-west-1.amazonaws.com/web/sample-audios/EN.wav" curl -H "keyId:${API_KEY_ID}" -H "keySecret:${API_KEY_SECRET}" -X POST -d "lang=${LANG}&remotePath=${FILE_REMOTE_PATH}" \ "https://api.speechflow.io/asr/file/v1/create"
# for local file API_KEY_ID="YOUR_API_KEY_ID" API_KEY_SECRET="YOUR_API_KEY_SECRET" # See more lang code: https://docs.speechflow.io/#/?id=ap-lang-list LANG="en" FILE_LOCAL_PATH="YOUR_FILE_LOCAL_PATH" curl -H "keyId:${API_KEY_ID}" -H "keySecret:${API_KEY_SECRET}" -F "file=@${FILE_LOCAL_PATH}" \ -X POST "https://api.speechflow.io/asr/file/v1/create?lang=${LANG}"
둘째, taskId를 다음 코드에 복사합니다. 터미널에서 코드를 실행하면 트랜스크립션 결과가 반환됩니다.
API_KEY_ID="YOUR_API_KEY_ID" API_KEY_SECRET="YOUR_API_KEY_SECRET" TASK_ID="THE_TASKID_RETURNED_IN_THE_FIRST_STEP" curl -H "keyId:${API_KEY_ID}" -H "keySecret:${API_KEY_SECRET}" \ "https://api.speechflow.io/asr/file/v1/query?taskId=${TASK_ID}"