ラベル SONiKA の投稿を表示しています。 すべての投稿を表示
ラベル SONiKA の投稿を表示しています。 すべての投稿を表示

2013/12/21

「初音ミクV3 ENGLISH」ってば:補足の補足 or Piapro Studioがいよいよ使い物になるか?!

 Piapro Studioのバージョン1.2がリリースされて、クリプトン社以外のボーカロイドも使えるようになったよ。技術的な問題があったのか、囲い込み戦略があっさり破綻したのかは不明だが、ユーザー寄りの展開は一度は苦言を呈した手前、大歓迎だとはっきり書いとかないとね。

 以前に書いたと思うけど、初音ミクの声?質にさっぱり魅力を感じない類の人間故、Piapro Studio自体が塩漬け状態だった。最後のミックスダウンまでそのまま使うことはないと思うけど、DAW上でのラピッドプロトタイピングには重宝しそう。テンポ変更の制限が無くなるからバックトラック作成に先行する「歌先」も可能で、ワークフローを根本的に変えることになるかもしれない。

 あ、V3 Megpoidだけでなく、V3にインポート済みのV2 Sonikaも使えるようになるよ。

2013/09/30

「初音ミクV3 ENGLISH」ってば:補足

 先のエントリで、「初音ミクV3 ENGLISH」、「Megpoid ENGLISH」及び「SONiKA + V3 Vocaloid Engine」の周波数分布特性について触れたけれども、実のところ自分の耳に基づく見解だった。耳には結構自信があるから不安などは感じないものの、やっぱりちゃんと一度定量的に確認しておいた方が良い。という訳で、3つの英語ボーカロイドの同じ英語フレーズ(同じvsqxファイル)の周波数分布を調べてみた。使用したアプリは"Sound Engine FREE"、これは優れモノですよ。

 実際に周波数スペクトルの時間変化を見ても、結論は変わらなかった。赤~オレンジが音声を特徴付ける周波数成分。一番下が音程を決める周波数、下から2つ目より上がフォルマント周波数だ。

 Megpoid Eng.は音程を決める周波数より下の周波数成分が他と較べて低く、こもったような「もこもこ感」が出にくいのは明らか。またMegpoid Eng.とミクV3 Eng.の500~1kHzの中周波数成分の有無の違いは明確だ。「ミクV3では中周波数域をイコライザーで持ち上げても全然美味しくない」のはそもそもその周波数領域がスカスカだからだということが良く分かるねぇ。

 にしても、V3 Editorは何時まで待てばバグフリーになるのかねぇ…

2013/09/29

「初音ミクV3 ENGLISH」ってば

 ボーカロイド製品のアクティベーションでは専用サーバーへの接続が必要だ。

 聞くところによると昨日はそのサーバーが高負荷で落ちちゃったんだそうだ。凄いもんだね「初音ミク」は…とか書きつつも、実は私もサーバーダウンの影響を受けた一人。おそらくサーバー復旧前後に何回かアクティベートに挑んだタイミングだったようで、4回ほどネット接続エラーでアクティベーションに失敗。成功するまでに迷惑メールが11件届いちゃったよ、あ、俺のPCちゃんとネットに繋がってるじゃん、あははって感じ。

 これで一気に「初音ミク楽曲の質が向上」なんてことが「もし」起ってしまった場合、その原因分析はちょっと面白いですよ。はたして原因は「初音ミクV3」の出来の良さなのか、それともMacもサポートしたことなのか、とか。大げさに言えば、林檎使いは窓使いよりも本当にセンスが良いのかっつー話にけりがが付くかも知れんよ、ということですよ。俺みたいな元熱狂的林檎使い(SYSTEM6まで)はどっちですか?

 で、知ってる人は知ってるように、俺は基本的に「ボーカロイドはウィスパー系以外は英語バージョンしか買わないよ」という人、ということは裏を返せば「初音ミクV3 ENGLISH」は買っちゃう可能性はある訳で、ハイハイもちろん買いましたよ、と。アクティベーションの件はそういうことです。

 んで、「初音ミクV3 ENGLISH」はどうなのよ、という話なんだが、なんだかなぁ…。自分の中のベンチマークは"VOCALOID2 SONiKA+V3 Voacloid Engine"で、こいつは余裕で超えてもらわないといかんのだけれども、ん~。

 滑舌は明らかに「Megpoid Eng. > 初音ミクV3 Eng.≧ SONiKA+V3 Engine」、これはフォルマント特性とも無関係じゃない。

 "Megpoid Eng."はとにかく声がひっくり返ることが多くて難渋するが、これまで触った限りは"初音ミクV3 Eng."はほとんどひっくり返らない。と言うか、"初音ミクV3 Eng."(そしておそらく「初音ミク」自体)が「声が裏返りっぱなし」なのだろうと。なので編集しててもなかなか味が出ないと言うか、1時間も聞いているともう勘弁というか、触る度に使う気が失せるというか、少なくとも触ってても面白くはないことと、意外に「初音ミク楽曲」では声質自体がいじられてきていないのだなということを身をもって知った次第。

 周波数の話をすると、"VOCALOID2 SONiKA"自体は30Hz以下の低周波数成分が多く、かつ2kHz以上の高周波数成分が少ないので、全体としてもこもこした印象になる。低周波数成分はイコライザーで削れば良いのだが、中周波数成分とのバランスを取るために高周波数成分をイコライザーで持ち上げると音質が全体としてどうしてノイジーになり、さらに音自体が痩せてしまう。結果、「もこもこ」か「(痩せて)スカスカ」かの二者択一とならざるを得ない。"Megpoid Eng."は中~高周波数成分ともに多めで、強めにイコライザーを利かせても音が痩せにくく、声質が変わらない範囲で落とし所を見つけ易い。周波数成分分布は"Megpoid Eng."が実際の人声により近いので、人声を使う場合のノウハウがかなり活用できる。

 "初音ミクV3 Eng."は低、中周波数域ともに低く、もともとからして「痩せた」音だ。確かにこれはいじり代がない。破綻しにくいという意味では使い易いのかもしれないが、引き出しが一個しかないようなもの、というのも如何なものか。

 "VOCALOID2 SONiKA"でも、「もこもこ」と「スカスカ」を重ねて使うという奥の手が実はある。それぞれの音量とリバーブのカットオフ周波数域の設定によっては格段に聞き易い音質になるよ。

 ちなみに"初音ミクV3 Eng."で中周波数域だけ豪快に持ち上げると、個人的には何を言っているのか分からなくなる。要は重要なフォルマント成分が高周波数寄りにあるということだろう。「声が裏返りっぱなし」というのはそういうことだ。おそらく、Skypeとか通しても何を言っているのか分からなくなるんじゃなかろうか。

2013/03/04

SONiKAユーザー向けMegpoid Englishセカンドインプレッション

 丸一日格闘しました。結論は、「英語の歌は歌わせるな。」

 いや、正確には「英語の歌を普段から英語を使っている人間が歌っている状態のシミュレートには使うな。」といったところ。出来上がりイメージとして英語ネイティブの歌唱を持っていると、何時までいじってもまとまらない。まぁ、日本語の歌詞に何気に英語が混じっている場合にワンポイントで使う、というのが本来の使い方なのだろう。

 "The Look of Love"をやらせると結構面白かったのだが、どうしても日本人の英語にしか聞こえないというのはある意味凄いことかもしれない。海外の人が何人も指摘しているが、SONiKAの発音は「実にブリティッシュ」なのだそうだ。まぁ、自分のSONiKAの使い方は自分の中のヨーロッパ風歌唱のリアライズだから、実はSONiKAの使用は正解寄りのはずだ。対して「Ja-nglish(日本語なまりの英語)の座りの悪さ」はネタとして以外は使い道が思いつかない。(文法的に正しい限り、日本語なまりの英語は非英語圏の人間にも聞き取り易いのだそうだが。)

 音がもこもこしようが、合成時にノイズが入ろうが、英語の歌を歌わせるのならやはりSONiKAの方が上(それでも曲は選ばねばならないが)、残念。

2013/03/01

SONiKAユーザー向けMegpoid Englishファーストインプレッション

 毒を食らわば皿まで。デモ曲も聞かずにMegpoid English導入しましたよ。

 取り合えず、SONiKAで作った"Fly Me to the Moon"と"Always Look on the Bright Side of Life"をV3 Editorにロードして歌手を変更して再生してみました。ファーストインプレッションをば…

・発声タイミング、Velocityに対する感度がSONiKAと微妙に違う。少し編集しないとダメっぽい。

・10~20kHzあたりの高周波数域が気になる。合成の影響か、ボイスバンク自体がそうなのかは調べてみないとなんとも言えない。まぁ、イコライザで削る分には、元々このあたりの周波数が不足気味のSONiKAのボイスバンクより筋は良いと言えば良い。

・[v][kh I][p][f I]の発音がVelocityなどでかなり印象が変わる。[l0][@r]には違和感あり。SONiKA向けの調整のままだと、[Kh I][f I]は大音響、[p]は逆に小さくて良く聞こえない。"love"、"kiss"とか、良く使う単語に含まれる音なので重要なんだけどね。

 今週末は、"Fly Me to the Moon"で調整にトライ!

2013/02/10

SONiKAでポルトガル語曲に挑もうか、と考えてみたものの…

 iTunesのGeniusのレコメンド曲がバッチリ好みなんて経験は未だ無いのだが、それでも何か発見があるんじゃないかと視聴はしてしまう。

 一週間ほど前に明らかに好みから外れた曲をレコメンドされたが、その曲を含むコンピレーション・アルバムに1曲だけピンと来た曲があった。Kaleidoscopio(Kaleido)のMadalena (Youtube)である。

 実はこの曲、別のコンピレーション・アルバムの1曲として既に入手していて、一時期はドライブ時のヘビロテ曲でもあった。まぁ、CDの山から昔良く聞いていたCDを弾みで発見してしまったようなものである。

 インターネットとは便利なモノ、検索で色んなことがすぐに分かる。MadalenaのオリジナルはElis Reginaの歌唱によるもの、歌詞は基本的にポルトガル語(ただし当然ブラジル風)である。「Elis Reginaなんて知らねーなぁ」などと思うのもつかの間、愛聴盤である"Elis & Tom"のElisその人である事に思い至って冷や汗…職場にテクノの話で盛り上がれる人間はいるが、ボサノヴァなどのブラジル音楽の話ができる人間はいない…恥をかかずに済んだといったところ。まぁ、これも一種の再発見である。

 そのあとも色々あったのだが省略して、本題。SONiKAにポルトガル語を歌わせることができるか、という点を改めて調べてみたところ…という話である。

 これも顛末は省略するが、うちのiPodにはポルトガル語-英語辞典を入れてあるので、早速ネットで拾った歌詞の単語の発音と意味をチェックしていく。フランス語にはリエゾン、ドイツ語には動詞の枠構造などの個人的には鬼門があるのだが、ポルトガル語にも二重母音やら「名詞と形容詞は性数に一致」という別の鬼門が待っている。名詞に性も数(単数形と複数形)もない日本語使いとしてはとても辛い。相対的に英語は簡単、というのは実は本当だとつくづく思わされる。

 結論から言うと、真面目にやるのは無理。いきなりpercebeuという単語でお手上げである。この単語は動詞perceberの二人称複数・現在・直接法の活用形で、意味は「理解する」「知る」といった辺りかと思う。発音はカタカナ的には「ペッセベェゥ」と聞こえるが、正確には[pexsebew]となる。実は[x]が曲者、英語にも日本語にも基本的に無い音なのだ。もちろん、英語Vocaloidの発音表にも記載はない。ちなみにネッシーで知られるネス湖を指すロッホ・ネスの「ッホ」は[x]らしいのだが、綴りがLochとあっては英語本来の発音とは思えない。

 [x]は無声軟口蓋摩擦音、バッハの「ッハ」、押井守作品好きには「マッハ軒」の「ッハ」なのである。カタカナ的に「ッ」が入った時点で既にマズいということ、少なくとも英語には無いからねぇ…。

 あ、ちなみにウズベク語歌曲に挑戦して挫折した経験が既にあります。