PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   軟體字幕討論區 (https://www.pcdvd.com.tw/forumdisplay.php?f=72)
-   -   [教學]SUB字幕轉SRT連同校正不用5分鐘搞定!SubRip、SubToSrt字庫檔下載 (https://www.pcdvd.com.tw/showthread.php?t=653762)

sydstf 2006-12-05 06:54 PM

Barry大您好,我已經照著您的方法成功轉過幾部片子了,不過有一片不管怎麼轉就是不成功...以下為我的狀況,希望能幫幫忙,感激不盡!!

我是想轉一片mkv檔的片子裡的字幕檔,我已先用mkv tool把字幕檔擷取出來成一個.idx,一個.sub,但是當我用subrip的時候,我發現subrip在擷取完後,會少兩句字幕!(就是這兩句造成某段時間之後的所有時間軸混亂OTZ)

我試著重新擷取好幾次,但無論我試了多少次,subrip擷取完後的最後一句時間秒數永遠比.idx檔裡的timestamp少...所以經過我比對原mkv檔的字幕後,我是發現subrip少擷取了兩句.....不知道是subrip本身問題嗎@@(因為擷取其它片子不會漏句子...)。

而subrip擷取完畢後會出現一個錯誤訊息

"subtitle timecodes are overlapping 24x"

不知道哪裡有問題??(我用原mkv檔觀看正常,但是想把字幕擷取下來外掛,因為不喜歡原mkv檔的字型)

先在這謝謝幫忙了!!

laputa38 2006-12-05 11:23 PM

給你最簡單的方法
把做出來的字幕漏掉的地方補上
再用Subresync調時間軸,花不了多少時間
你也不必要再那研究老半天...
也可能是IDX或者是SUB中的語法有錯,SUBRIP認不出來吧>"<

mackai 2006-12-26 07:49 PM

好文章都全部整理在一起
慢慢爬文

BarryTW 2007-03-31 11:42 AM

[教學]瞬間訂正中文SRT字幕檔的錯字
 
[教學]瞬間訂正中文SRT字幕檔的錯字
詳細教學:http://tw.barry.googlepages.com/08.htm

經過SubToSrt辨識後的SRT字幕檔會出現許多錯字,有沒有又快又有效的錯字訂正方法呢?


瞬間訂正中文SRT字幕檔的錯字方法:
方法一:使用ConvertZ
使用ConvertZ將原本是繁體字的字幕檔轉為簡體字,再用ConvertZ把簡體轉為繁體
字幕這樣經過ConvertZ「過水」,就可解決一部份的錯字
ConvertZ用來轉換簡體繁體很方便!但ConvertZ並不是特別針對SubToSrt的錯字校正而設計的
用ConvertZ並不能完全解決錯字的問題,不推薦使用!
 
方法二:使用EmEditor + 我提供的中文macro檔(cht.jsee)
以前我一直都是用ConvertZ配和字串取代的方式來訂正錯字,但是這樣漏網之魚很多
後來我用EmEditor寫了一個中文訂正macro檔(cht.jsee)
可以瞬間訂正字幕檔的錯字,效果非常好!推薦使用!
其原理是用字串取代的功能替換錯別字,我會持續更新cht.jsee裡的字串,讓訂正功能更完善
EmEditor是一個文字編輯器,可以說是簡化版的UltraEdit,但功能比Windows內建的notepad強太多了,可以完全取代
EmEditor有自動偵測http://超鍊結功能(在純文字檔中可直接開啟URL連結),還有很多實用的plug-in可下載
推薦使用EmEditor來開啟、編輯SRT字幕檔或是一般文字檔!(設定檔案關連性後,就可直接以EmEditor開啟SRT檔)

使用前先安裝EmEditor這文字編輯器,再下載我提供的中文macro檔(cht.jsee)
macro檔下載:http://tw.barry.googlepages.com/08.htm
使用步驟:
1.以EmEditor開啟SRT字幕檔(或設定檔案關連性,直接點選SRT字幕就可開啟EmEditor)
2.「巨集」→ 「選取」→ 選cht.jsee
3.「巨集」→ 「執行(R)cht.jsee」或直接按&nbsp; 「功能鍵F4]

BarryTW 2007-03-31 11:46 AM

[教學]瞬間訂正英文SRT字幕檔的錯字
 
[教學]瞬間訂正英文SRT字幕檔的錯字
詳細教學:http://tw.barry.googlepages.com/08.htm#8-2

因為大寫的I 與小寫的L字型非常類似,使用SubRip將英文SUB轉為SRT字幕後會分辨不出來,需要作訂正
如何瞬間將訂正英文SRT字幕裡的錯字呢?


瞬間訂正英文SRT字幕檔的錯字方法:
方法一、使用SubRip本身的拼字訂正功能
SubRip本身就有「拼字訂正」功能,只是網路上很多教學根本沒有提到這一點
分為兩種情形:A.你要自己將英文SU字幕轉為SRT字幕、B.已有現成的英文SRT字幕
A.如果你要將英文SUB字幕轉為SRT字幕:
請看http://tw.barry.googlepages.com/02.htm#2-2 步驟六這拼字訂正功能一定要做

B.如果你已有英文SRT字幕檔,想要訂正錯字:
1.開啟SupRip,按下紅色框框內的按鈕,再「File 」→ 「Open」開啟你想要訂正錯字的SRT英文字幕
2.http://tw.barry.googlepages.com/02.htm#2-2 步驟6:拼字訂正,步驟7:存檔


方法二、使用EmEditor + 我提供的英文macro檔(eng.jsee)
macro檔下載:http://tw.barry.googlepages.com/08.htm
使用方式同前述的中文SRT字幕檔錯字訂正
1.以EmEditor開啟英文SRT字幕檔(或設定檔案關連性,直接點選SRT字幕就可開啟EmEditor)
2.「巨集」→ 「選取」→ 選eng.jsee
3.「巨集」→ 「執行(R)eng.jsee」(或直接按「功能鍵F4」)


方法三、使用Srt Learning media player
http://diaxmond.googlepages.com/index.htm
http://www.pcdvd.com.tw/showthread.php?t=696577
這軟體功能很強!除了訂正英文SRT檔錯字之外
還有看影片學語言功能(中英雙字幕、設定時間區域重複播放、自動匹配時間碼、快速時間碼微調)
以下是使用Srt Learning media player來訂正大寫I及小寫L 的步驟:
1.開啟Srt Learning media player
2.按右鍵選「工具」→「ocr字幕之LI校正」→ 切換至「有問題的srt檔」
3.將欲訂正的英文SRT檔直接拖曳(drag)到綠色區域,按「開始轉換」就可完成訂正
 

補充說明:
1.有些網路上的英文SRT字幕會有大小寫LI不分的情形,那是因為當初在辨識時沒有使用拼字訂正功能
2.[方法二]、[方法三]是用於開啟現有的英文SRT字幕做拼字訂正
3.[方法一]不論是自己轉SUB字幕或是開啟現有的英文SRT字幕,都可以訂正
4.[方法二]是我針對SubRip會將大寫的I誤辨識為小寫L而設計的,可自動判斷在句首、句中、句尾的小寫L是否要修正為大寫的I

sweetheart5720 2007-04-09 11:07 AM

很實用的網站~ 先加到我的最愛~ 晚點仔細閱讀一番~ :ase

evabt 2007-04-18 10:14 AM

太感动了,终于找到个可以好好学习的地方!

BarryTW 2007-04-22 07:56 PM

再補充一個訂正中文字幕檔錯字的方法

我一直都沒仔細看過SubToSrt原作者的說明檔
前陣子才發現SubToSrt有「詞組替換」功能

「詞組替換」主要是用來替換慣用語,如:冰激淩=冰淇淋,荷李活=好萊塢
其實「詞組替換」也可以用來訂正錯字,效果很好!
原理跟方法二相同,也需要自己慢慢累積
開啟SubToSrt編輯「詞組替換設置」,或直接編輯replace.sys

辨識繁體中文:replace.sys 需為Big5碼
辨識簡體中文:replace.sys 需為GBK碼

另外
也可以將我提供的cht.jsee用取代方式轉成replace.sys格式

lys1211 2007-09-08 01:07 AM

BarryTW大,您的網站還真熱門
試了好幾天都是:The bandwidth or page view limit for this site has been exceeded.
流量爆了,無法入內
能否請教有無備份站點?
:ase

tonyhsie 2007-09-15 02:44 PM

BarryTW 兄的網頁作的很好,可惜常常爆流量...不曉得需要多大的空間
有需要的話 我可以提供 HiNet 的網頁空間 :)


另外,對中文字幕庫的校正,個人有些淺見

引用:
SubToSrt 是大陸人的作品....所以內附的字庫是簡體字


雖然可以轉成繁體字庫, 不過對字幕辨視並沒有幫助...建議砍掉重新自己建字庫

(因為我們需要把 "繁體 sub 圖 -> 繁體字",而對岸字庫大都是"簡體圖 -> 簡體字"
就算自行把字庫繁體化,結果變成 "簡圖 -> 繁字"...根本無用)



從我開始用 SubToSrt 開始,直接砍掉內建字庫,也不合併網路上繁簡夾雜的字庫
從 0 開始,一個一個 key-in,以確保字幕的品質,到現在也有七萬字左右

每個字的來源都是 R3 DVD 的繁中 .sub 字幕,完全不需校正


個人是覺得這樣的方式比事後校正來得理想的多…@@


所有的時間均為GMT +8。 現在的時間是02:52 PM.

vBulletin Version 3.0.1
powered_by_vbulletin 2024。