透過知名美國人工智能獨角獸 Hugging Face ,一間受到 Google, Amazon, IBM, Nvidia, Intel 等科技巨企注資,並且係人工智能行內知名嘅公司,提供嘅免費 API 嚟幫你將 WhatsApp 錄音等音訊檔案變成文字嘅工具。因為係採用 OpenAI Whisper Large V3 model 所以效果會比其他直接係裝置上作出處理嘅方法好好多。
A: 呢個工具係完全免費提供嘅。由於所使用嘅 API 並唔係由我控制而係由 Hugging Face 控制嘅,所以同某啲坊間其他服務唔同,我係無辦法對你用個 API 呢點收費的。至於 Hugging Face 嘅免費 API 服務都提供咗好一段時間,將來會唔會停止提供都係未知之數,但係呢一刻未見到有停止提供免費 API 服務嘅跡象。
Q: 咁你點賺錢?
A: 我都唔知,個 API 本身就係免費嘅,其實唔駛我俾錢,我只係付出少少時間成本整個 shortcut 放出嚟俾大家用,暫時都睇唔到呢舊嘢有任何盈利嘅前景。
Q: 點解會整呢個 app / website / shortcut?
A: 因為呢排(2024年1月頭)留意到有意見認為坊間某個都幾多人用既相關產品係透過一個架設係「香港 office local run」(並非猜測,係由疑似係創辦人嘅用戶係某討論區透露嘅)嘅伺服器運行,所以有安全同埋私隱上面嘅隱憂,咁我就諗到可以用 Hugging Face 呢啲信譽相信比較好嘅企業嚟進行語音辨識,咁大家就唔洗擔心自己既錄音被用嚟做不知名用途啦, Hugging Face 有明確嘅 Privacy Policy 去規定你嘅資料可以使用作咩用途。
Q: 你個 app/shortcut 會唔會攞我啲錄音賣俾 CIA MI6 架?
A: 首先呢我係完全唔會接觸到你啲錄音嘅,你嘅錄音檔案係直接上傳 Hugging Face 嘅 server 上面,唔會經我手,你唔信我嘅話可以自己 check 下個 shortcut 啲 logic。至於 Hugging Face 會唔會攞你啲資料去賣呢?我唔係律師,我只可以話你嘅資料受到美國法律,Hugging Face Terms of Service 同埋 Privacy Policy 嘅保障,而根據 Hugging Face Privacy Policy,你嘅個人資料係有機會會同特定個體分享`嘅,實際上所有呢類型公司嘅 Privacy Policy 都係咁寫,啱唔啱你心水就見仁見智啦。當然對於有敏感或者私密內容嘅錄音我都係建議你自己聽番算。
Q: 點解我要信你?
A: 我都覺得你唔應該信我,事實上你唔應該將你嘅私人錄音交俾網上面隨便一個人,就算係大型科技企業都最好要係上傳之前再三考慮,更何況係普通人呢?為咗確保大家唔需要信我或者任何一個路人甲,所以我上面提供嘅解決方法係完全唔會俾我接觸到大家既任何錄音或者其他資料,就算有 CIA 特務上門要我交啲錄音出嚟我都只可以叫佢哋去搵 Hugging Face 😅,我爱莫能助。我亦都承諾呢個 page 入面提供嘅 app / shortcut 等嘅解決方法都係會確保任何錄音資料係 100% 唔會經我手的,亦都會確保呢個承諾係可以俾各位科技同業作出核實嘅,希望大家可以放心使用。目前所提供嘅 iOS shortcut,下載之後就可以打開修改版面核實入面既程序邏輯,各位同業可以核實。
Q: 點解會有時會出熱身兩分鐘或者會 load 好耐?
A: 無辦法,個免費 API 免費得俾你自然係有 rate limit 限制架啦,Hugging Face 個系統會需要時間熱身,所以有時要等或者提示你要兩分鐘熱身,目前已經盡量用技術手段降低 loading 時間同埋做好啲個等待時間嘅用戶體驗,不過有時都係始終要等。