YouTubeに高画質でムービーをアップする(2)

その(1)http://d.hatena.ne.jp/gamme/20070525/1180108893
しばらくほっぽっておいた高画質ムービーをYouTubeにアップするのにまたチャレンジしてみました。以前のチャレンジは「いやーむしろ画質はこのぐらいの方がかっこいいんじゃないかな〜(笑)」という評価もありましたが、こんなのとかこんなのとか見ちゃうともうちょっとなんとかなるのでは...と思ったのと、また最近いろいろ新しいツールなんかも見つけたので、ちょっと試してみようかなと思って。



前回までのおさらい:

ええと、「高画質ムービーをYouTubeにアップする」ということはできるのです。でもアップした際にYouTube側でYouTubeルールでデコード(Flashムービー化)されてしまい、結果、画質が落とされてサウンドはモノラル、フレームサイズは320x240(表示する大きさは450x340だけど)にされてしまうのです。だから、どんなに10分以内、100MB以内にがんばって高品質の画像を作っても、どんなフォーマットでも、Flash化する際に画質を落とされてしまう。

おはYouTubeを使ってYouTubeにアップされてる画像をダウンロードしてローカルに保存して、QuickTime(Pro7.2)でムービーの情報を見てみると、その映像の見え方の差があるもののも一律:

フォーマット:Sorenson H.263、320X240
MPEG Layer 3、モノラル、22.050kHz
フレームレート:<30(29.97とか29.54とか)
データレート:<320kbps

になっていました。なので、この値にできるだけ近い値で理想的画質を保ったエンコードすることがway to goなわけです。

環境は以前と変わらず、PowerBook G4(CPUは1GHz、メモリは2GB)。

今回試してみた映像は、以下の難しい条件がある、38秒の映像。

  • 音楽がある(ボーカル、コーラス、アコースティックG、エレキG)。
  • しかも演奏しているエレキギターは銀ラメ。
  • しかもギターを演奏してる人のシャツが濃い色に白い細い横縞。
  • 歌っている人の顔のアップがある(色白な感じ)。
  • その顔アップシーン以外はパン&ズームしているシーン。
  • 画面は全体的に暗めだけどスポットライトが当たってテカっているところがある。
  • 映像はアナログビデオテープよりエンコードした。もともとの画質はあまりよくない。

まず、アナログ映像のデジタイズ。普通の民生用のDVDデッキの出力ポートからcanopus ADVC110経由でiMovie HDに映像を取り込んで.movで保存した。その映像データが【1】。QuickTime Player7.2で再生して見てみると、申し分のない映像クオリティー

【1】
フォーマット:AAC、モノラル、48.00kHz,H.246、450x340、約1670万色
FPS:29.97
データ容量:63.47MB
データレート:13.77Mbps

これにどこまで近い状態でYouTubeにアップできるか。まずはこのまま素でアップしてみた【test1】。ファイルがデカいだけにアップするのにちょっと時間がかかりました。で、YouTubeでオンエアできる状態になったものを見てみると...音は、変換されたことは解るがまあ聞けるレベルにあるものの、映像は8ptくらいの大きさのブロックノイズが乗ってしまっている。

おはYouTubeしてダウンロードしてその情報を見てみる【2】。

フォーマット:Sorebson H.246(Perian)、320x242、不明、MPEG Layer 3、モノラル、22.050kHz,
FPS:29.94
データ容量:1.40MB
データレート:302.66Kbps

変換されてファイルサイズがダントツ小さくなっている。あとはまあ、前調査通りに変換されていた。データレートが300kbpsちょいしかないのがちょっと不満。320kbpsまであるはずなんだけど…。

同じソースを.aviに変換してアップしてみた。iMovie HDの書き出して.aviで保存。YouTubeは.aviでもアップ可能なので。データは【3】、アップ後の映像は【test2】。

【3】
フォーマット:Appleシネパック、450x340、約1670万色、16ビット整数(リトルエンディアン)、モノラル、22.050kHz,
FPS:31.58
データ容量:34.04MB
データレート:7380.75Kbps

.aviで保存をしたものの方が、.movよりもインターレースノイズが目立つような気がします。アップロード後の変換の結果、先ほどよりさら荒れがヒドい気が(T_T)。インターレースノイズは消えたっぽいけどブロックノイズが大量発生!になってしまったし、ところどころににじみというかぼけが入っている。ブロックノイズの出る所と出ないところがあるのか? これは画像変化の予測計算の癖? エッジも潰れがち。

さて、この劣化をどこまで防げるか〜。今回は、ノイズリダクション機能のついたツールを使ってこちらで画像を加工し、できるだけYouTube側で変換されたときに画質の劣化が起らないようにしてみる。しかーもワタクシとて資金が潤沢にあるわけではないので、できるだけフリーがシェアウエアのツールを使ってみた。

Macでノイズリダクション機能があるので手に届きそうだったのは、D-Vision3。しかしこれは、ソースファイルは.vobしか受けない。iMovie HDでは.vobにインポートできないんだよなあ…。DVDから直接リップすればいいのかもしれないけど、今回はソースをiMovie HDで取り込み、で用意しちゃったので、.movを.vobに変換してみることにした。

今回ピックアップしてみたツールはVisualHub。バージョン1.26を試用。試用だと2分までのエンコードがフル機能で使える。試すにはありがたい。ちなみに、23.32ドル。2800円ちょい。

画質を標準に、あと、画像サイズをここで320x240にリサイズして.vobにエンコードした。

これをD-Vision3で.aviにする、っていうか、D-Vision3はH.264フォーマットを選ぶと.aviにしてくれる。最初、ディメンション(画像サイズ)を変えることができなかったので、そのままエンコードした。設定は【図4】【図5】。


で、出来たファイルは…あれ、画面サイズが大きくなっちゃっている…ここ、設定変更できなかったからしなかったはずなんだけど…。ビットレートも上がっている…。あ、そうか、ビットレートを設定したところは「ビデオ」の設定のところだったから、音の分がそこに乗っちゃったんだ。

できたファイルをQuickTimeで見て見ると、音がやたらとでかくなっている。音量を調節するところもなかったぞ(^_^;)。音のビットレートも設定よりも高いぞ。そして、ファイルの最後に白い画面と「ビビビビー」みたいな音のノイズが入ってしまっている(泣)が、取りあえずYouTubeにアップしてみた、【test3】。うーん、劣化ヒドいなあ。

ビットレートを理想の320kbから音の96kb分を減らして、230kbでやってみた。【test4】。

【6】
フォーマット:H.264(Perian)、512x384、約1670万色、MPEG Layer 3、モノラル、48.000kHz,
FPS:29.94
データ容量:1.91MB
データレート:411.50Kbps

音、相変わらずデカい。画像の質、…うーん、まだ悪すぎだ。

ディメンションを変えられないのか、D-Vision3のヘルプから聞いてみた。なんと4時間後に返事が来た。マニュアルで指定できるようになるらしい。早速やってみる。音も32kbにしてみる【図7】【図8】【test5】。


ローカルで320x240で見ている分にはいいけど、YouTubeにアップされたのを見るとちょっとシャープさが足りない感じ。おはYouTubeしてみたら、総合ビットレートが310kbpsになってしまっている〜。もう10kbpsちゃんとくれよ〜。貴重なんだからさ〜。

とりあえず、まずちょっとD-Vision3でシャープさを変えてみた。sharpnessのメモリを、一番右に設定してみた。その他は前と同じ。うーん、ローカルで見ても前よりもブロックノイズが乗っている気がした。特にギターを弾いているところのアップは、銀ラメギターに手の動きが被っていてその後ろには縞のシャツ、(^_^;)、ブロックノイズもインターレースも乗っかってしまっていた。思い切ってsharpnessを切ってみる【test6】。うーん、まだ滲むなあ。D-Vision3ではこれが限界か?!

元ネタ.movをVisualHubで、素で.flvにしてみた。画質は最高で。すると、出来上がりで320x240にリサイズされていた。データレートは833.42kbps。圧縮上限の2倍以上かあ、と思いつつアップしてみたら、やっぱりだめだ、思いっきり圧縮されて、ブロックノイズが乗ってしまった。【test7】。

D-Vision3で、シャープネスを一番左にして、オーディオのビットレートを不可比にしてみた。とりあえず素でエンコードして、はみ出たビットレートをビデオのビットレートから引いて設定し直して、再エンコードしてみた【図9】【図10】【test9】。


思ったほどキレイになっていなかった。きれいなシーンもあるけど…。

これだけ動きのある映像だと、2-passの効果はあまりないかも。動き有りまくりだし、輝度も移動しまくりだしね。


(続く)