補充說明網路教學Open AI Whisper和Google Colab影片的操作步驟1.首先進入Colab:https://colab.research.google.com/drive/
Google Colab:全名是 Google Colaboratory,是一個基於雲端的免費 Jupyter 筆記本環境,讓使用者可以在瀏覽器上寫程式碼,並且可以利用 Google 的雲端運算資源執行程式碼。
Open AI Whisper: OpenAI 提供的一種開源的自動語音辨識( Automatic Speech Recognition,ASR )的神經網路模型,用來執行語音辨識(language identification)與翻譯(speech translation)的功能,能將各種語言的語音轉錄成文字(multilingual speech recognition),甚至可以處理較差的音頻品質或過多的背景雜訊。
Google Colab 搭配 OpenAI Whisper,快速將影片或錄音檔轉換為逐字稿和字幕檔,完全免費、高準確度,不受時間及檔案大小限制,步驟如下:
3.然後取得適用的OpenAI Whisper,下載成.ipynb檔後上傳至自己的GOOGLE雲端
3.進入Colab後,從雲端執行Transcribe_and_Translate_with_OpenAI_Whisper。
4.到右邊步驟下面找「播放鍵」,按照步驟點選執行程式。
5.上傳需要逐字稿的mp3音檔(自己嘗試mp4檔案也行),程式會依前30秒自動判斷語言。
6.執行完會有各式txt、vtt、srt等文字檔出現,自行下載即可。