文字起こし(YouTube 後編)
字幕がない動画は google ドキュメントで音声を文字化できる(音声入力機能+音声認識)。
これにより動画音声を文字化すると欧米系の言語は概ね実用レベルだ。Linux でもできる。
「姿三四郎」が見たい
ある日YouTubeで昔TV放送から録画された「姿三四郎」を見つけて一気に視聴した。
すると全26集のうち半分くらいしかUPされておらず、続きが見たくなった。
探したら何と、中文吹替版が最後までUPされているではないか。見たら大体解る。
但しこれは字幕機能が利用できない。どうしても中文音声を文字化したくなった。
認識取りこぼし
そういう訳で音声入力を利用したのだが、残念なことに取りこぼしが大変多い。
漢字変換がある言語ではうまく文字化できないのかな?
音質第一
試しに「薇羽看世間」の動画を普通に再生しながら音声入力してみたら大変良好だ!
という事は。。。音質だ!「姿三四郎」中文吹替版は画質も音質も共に悪い。
VHS録画の日本語版よりも悪いから、これは恐らく海賊版VCD からUPされたものか。
音量や速度も音声認識に影響あるだろうが、音質が第一で、音量や速度は二の次だ。
ここまで判った今、やっと「姿三四郎」中文吹替版には未練がなくなった。