2025年12月15日 星期一

AI整理:語音轉錄文字檔+排版=Soundwise +Perplexity

 從一個 mp3 開始:Soundwise.AI的第一步

最近工作上會議不少,近日想整理手邊留下了一堆檔名像「25_12_15_12_32_47_955.mp3」的錄音,但每次要重聽一小時再做筆記,根本撐不到半場就開始分心。於是開始找「不用安裝、直接在瀏覽器就能用」的轉錄工具,最後選了都在本機跑、不把音檔丟到伺服器的 Soundwise.AI。​

第一次丟檔上去的時候,其實有點半信半疑:打開網站、把 mp3 拉進中間的框框,畫面上就開始跑進度條,過幾分鐘後文字一路冒出來,還幫我分好時間段、顯示像「00:09:48」這樣的時間標記,點那一句就直接跳回原音檔對應的位置回放,省掉來回切播放器的痛苦。​​







免費方案,已提供「不限長度、不限次數」,唯一限制是速度會依照你自己電腦的效能來決定。 以我那台日常工作筆電來說,一小時的課程錄音,大概十來分鐘內就能轉完;如果同時還在跑 Excel、開幾個重網頁,轉錄時間就會再拉長一點,這也就是價格頁上把 Free 方案特別標註成「處理速度較慢」的原因。​​

P.S 用高速電腦,例如R9 5900X,8分鐘可以轉45分鐘的音訊。改用Intel 5 120u gpu


語音辨識方面,只要錄音品質還行(雜音不多、講話清楚),繁體中文的準確度相當可以,多數句子幾乎不需要大改,主要修正都集中在專有名詞跟口頭禪。像截圖裡課堂上有人說的「所以你看這些科技公司大黨」這種口語句,Soundwise.AI 幾乎完整抓到,後面只要把破句修順、把多餘的語助詞刪掉就能直接拿來用。​​

最後端出Perplexity作交棒,讓逐字稿變成可讀文章

有了 Soundwise 產出的逐字稿之後,下一步就是把「完整但很口語」的稿子變成「讀起來順的文章」。這裡就輪到 Perplexity 出場:先把 Soundwise.AI 的文字整段複製出來(可以選擇只貼自己已經校正好的部份),丟進 Perplexity,說明這是某堂課或會議的逐字稿,請它幫我整理成條理清楚、段落分明、保留重點內容的 Blog 草稿。​​

Perplexity 的優點在於,它不只是改語氣、調整用字,而是會試著看懂整段內容邏輯,幫你重新分章節、抓重點,自動整理成截圖那種「開場與近況更新」的小標題段落,既保留真實感,又比原始逐字稿好讀很多。 此外,它會附上引用來源,若中間提到特定公司或技術名詞,還可以順手補幾句背景說明,讓 Blog 讀者更容易跟上。​​



兩個工具搭配的工作流程:

實際跑了幾輪之後,大致形成一個固定的工作流程,分享給一樣有大量錄音要處理的人參考:​

用手機或電腦錄下整場課程/會議,檔名最好像你第一張圖那樣加上日期時間,方便對應。

回到電腦後,把 mp3 丟進 Soundwise.AI ,等待轉錄完成,順手在介面內修正明顯的錯字與分段問題。

把整理過的文字複製到 Perplexity,說明用途(例如「要寫成部落格心得」、「要整理成會議紀錄」),請它幫忙潤稿、加小標、濃縮重點。

最後再由自己做一次人工確認,把真正想說的觀點與補充加入文章裡,順便挑選像你這次截圖裡的畫面插圖,讓整篇更有現場感。

這樣組合下來,Soundwise.AI 負責把「聲音變文字」,Perplexity 則是把「文字變內容」。前者節省了聽打時間、後者則幫忙跨過「看到滿滿逐字稿卻不知道從哪裡開始寫」的門檻,大概從前期錄音到最後 Blog 發佈,整體時間可以壓縮到原本的一半甚至更少。​​

使用後的幾點小心得

用了一段時間,對這組搭配有幾個特別有感的地方。首先,Soundwise.AI 完全在瀏覽器上跑、不需要登入就能開始轉錄,而且官方聲明是「免費不限次數」,對一般上班族來說幾乎沒有入門門檻。 其次,Perplexity 的優勢在於善用即時網路資料與多模型架構,能在整理逐字稿的同時幫你補齊背景資訊,比單純的文案潤飾工具多了一層「研究助理」的感覺。

當然,兩個工具都不是「按一下就完美出稿」的魔法:錄音品質不好、講話本身就很發散的內容,最後還是需要人工重新組織;但如果你習慣像我這樣邊講邊思考、事後再整理,那麼「Soundwise.AI + Perplexity」這套組合,確實讓從聲音到文章的距離近了非常多,也讓那些原本只存在錄音檔裡的好內容,有機會真正變成對外可以分享的文字記錄。


小編自己的體驗,希望沒浪費到妳我他時間,哈




沒有留言:

張貼留言

AI整理:語音轉錄文字檔+排版=Soundwise +Perplexity

 從一個 mp3 開始: Soundwise.AI 的第一步 最近工作上會議不少,近日想整理手邊留下了一堆檔名像「25_12_15_12_32_47_955.mp3」的錄音,但每次要重聽一小時再做筆記,根本撐不到半場就開始分心。於是開始找「不用安裝、直接在瀏覽器就能用」的轉錄工...