声の権利を守って価値を未来につなぎ
声の経済圏の創出を実現する

10月27日、NTT西日本は音声AIに関する新事業「VOICENCE」の発表会を開催した。AI活用が急速に進む中、音声でも無断生成AIが問題視されている。これらは声優・俳優をはじめとしたIPホルダーに大きな影響を与える課題だが、現在の日本では声の権利を直接保護する規定が存在しない。そのため、無断生成AIによるブランド毀損や機会損失が拡大しつつあるのだ。この状況を打破するために、NTT西日本はどのような事業を始めるのだろうか。

“信用できる声”を作り出して活用
社内カンパニー化で事業を推進

 会見の冒頭では、NTT西日本 代表取締役社長 北村亮太氏が登壇した。北村氏はまず、生成AI利用が活発化した時代における音声の課題をこう話す。「当社は地域の通信インフラを支え、コミュニケーションをつなぐ企業として、長年人々の声を届ける役割を担ってきました。昨今、AIをはじめとしたテクノロジーの進化により、声そのものに新しい価値が生まれ、言語の壁をも越えられる可能性が広がっています。その一方で生成AIの普及などによって、声の無断利用やフェイク音声の拡散などが大きな社会問題になっています。声優、俳優、アーティストといった実演家の皆さまにとっても、自分の声をどう生かし、どう守っていくかが問われる時代になってきています」

NTT西日本 代表取締役社長 北村亮太氏は「実演家の皆さまは、自分の声をどう生かしどう守るかが問われるようになってきました」と問題を提起する。

 こうした課題を踏まえ、NTT西日本がローンチするのが、音声AI事業「VOICENCE」だ。北村氏は、VOICENCEの発表に向けた同社の意気込みを次のように語る。「無断利用やフェイク音声などではない“信用できる声”を作り出し、プラットフォームを築いて新しい文化や産業を生み出すべく、新事業のVOICENCEを立ち上げました。声の権利を守り、声の価値を未来につないでいくことを目指しています。VOICENCEを成功させるために、組織マネジメントには当社初の仕組みを導入しています。マーケットやテクノロジーの進化へ柔軟かつ即座に対応し、さまざまなパートナーさまとの協業をスピーディーに進めるために、本事業を推進するチームを社内カンパニーにしました。子会社と同様に独立の組織として、責任者とチームへの大胆な権限委譲を行っていきます」

信頼と品質を両立する本物のAIで
実演家・企業・生活者をつなぐ

「VOICENCEでは、本物の声と本物のAIが共存する世界を目指します」と語るNTT西日本 VOICENCEカンパニー カンパニー長/CEO 花城高志氏。

 北村氏に続いてはNTT西日本 VOICENCEカンパニー カンパニー長/CEO 花城高志氏が登壇し、VOICENCEの紹介を行った。花城氏は説明を始める前に、花城氏の声をAIで再現した英語音声を流し「数分録音するだけで自然な音声を再現できるだけでなく、多言語で話せるようにもなります。この一瞬に、私たちの未来が詰まっています」と同社の音声AI技術をアピールする。

 VOICENCEの名称には、声の権利を守る「License」と声の本質的な価値「Essence」を、「Voice」に宿すという意味が込められている。花城氏は、VOICENCEが目指す方向性について「声を安全に預かり、正しく活用し、その価値を高めていく新しいインフラ作りを目指しています。声を守り、育て、届ける。声の経済圏を作っていく。それがVOICENCEです」と話す。

 花城氏は、実演家の人生や感情がこもったオリジナルの声を“本物の声”と呼ぶ。対して、実演家の許可なく生成・模倣された無断生成AI音声を“偽物のAI”と呼ぶ。そしてVOICENCEが作るのは、本人の承諾と契約に基づき、信頼できる技術で声の権利を守り社会に生かす、“本物のAI”の生成AI音声だと強調する。

 ではVOICENCEは、どのような技術で“本物のAI”を実現するのだろうか。本事業で活用する研究開発技術は、主に二つある。

 まず一つ目は、信頼を設計する「トラスト」技術だ。ブロックチェーンを活用した真正性証明により、実演家本人の声から生成されたAI音声であることが証明可能なものになっている。さらに、契約に基づいた利用範囲を記録して、用途証明データとして付与を行っていく。これにより、実演家の許諾を得た本物のAI音声として、無断生成AI音声やフェイク音声と区別できるようになるのだ。

 二つ目は、声の表現力を進化させる「音声処理技術」だ。話者の印象や口調を変換する「音声印象制御」技術や、本人の声色のまま多言語に変換できる「多言語合成」技術といったものにより、高い表現力の音声コンテンツを作れるようになっている。なお多言語合成技術は、発表会時点(2025年10月27日)では日本語、英語、中国語、韓国語、フランス語、スペイン語の6カ国語に対応している。

 これらの技術によってAI音声の社会実装を目指すVOICENCEは、まずは声優や俳優といったIPホルダーとの安全なコミュニケーションの場として運用を開始する。今後はクライアントやパートナー企業がVOICENCEに直接アクセスし、AI音声の企画から契約、制作、活用までを安全に行えるプラットフォームへ進化させていく予定だ。
 なお2025年10月時点では、VOICENCEに声を預ける「VOICENCEパートナー」には、俳優・ビジュアルボイス 代表取締役社長を務める別所哲也氏、声優の花江夏樹氏、声優の春日 望氏、バーチャルタレントのKizunaAI氏などが名を連ねている。「それぞれの声が新しい表現となって、社会へ響き始めています。VOICENCEは実演家、IPホルダー、企業、ファン、そして社会、それら全てをつなぐ音声の共創プラットフォームです」(花城氏)

 さらに花城氏は、VOICENCEが果たす役割についても解説する。VOICENCEでは声のコンテンツプロデュース事業を展開していき、その機能は大きく二つあるという。

 まず一つ目は「ライツマネジメント」機能だ。この機能は声優や俳優といった実演家と正式に契約し、音声の収録からAI音声モデルの構築、生成されたAI音声の真正性証明データ付与までを行って、音声IPとして管理していくものになる。

 もう一つは「音声コンテンツ企画・制作」機能だ。音声IPをクライアント企業のさまざまな施策・サービスに組み込み、企画から制作・運用までをトータルでプロデュースするものになる。

 花城氏はVOICENCEの役割について、以下のように強調する。「VOICENCEは単なる制作会社ではありません。IPホルダーと企業、そして生活者をつなぐハブです。声の持ち主へ正当にライセンス料を支払い、企業は安心してAI音声を活用できる。生活者の皆さまは、好きな声をいつでも安心して楽しめる。この声の循環を生み出すことこそが、VOICENCEの最大の役割です」

VOICENCEの役割を示す図。実演家・企業・生活者の3者が安心してAI音声を使える環境を整えながら、ライツマネジメントや音声コンテンツ企画・制作を行っていく。

 VOICENCEは3年目に売り上げ10億円、5年目に100億円、10年目にNTTグループ全体として1,000億円の規模を目指す。この実現のために、3年目までに積極的なグローバル展開、5年目までに自社のAIコンテンツ開発やクリエーター人材の育成・流通などに取り組んでいく予定だ。加えて今後は、音声だけでなく映像も含めたコンテンツプロデュースにまでビジネスを広げていく。

 花城氏は最後に、VOICENCEの展開に向けて以下のように決意を語った。「当社は電話から始まった事業です。創業以来、ずっと声によるコミュニケーションを大切にしてきました。声には力があります。感情を伝え、人を動かす力があります。その声の原点に立ち返り、AI時代に人と人をつなぐ価値を、新しい形で進化させるのがVOICENCEです。声の体験を文化に、価値を経済に。声を通じて、社会と産業の新しい循環を生み出していきます。日本から世界の音声業界を創造する挑戦を、皆さまと共に広げていきます」

豊かな感情表現や多言語の会話が
可能なAIでグローバルな交流も

 本発表会にはVOICENCEパートナーから、司会として春日 望氏、ゲストとして別所哲也氏とKizunaAI氏が参加した。別所氏は実演家の立場から、VOICENCEへの期待を以下のように語る。「VOICENCEの試みについて花城さんからお話をいただいたとき、真っ先に素晴らしいなと思いました。コンテンツライツは20世紀型のビジネスモデルから、大きく変革しようとしています。私たちのようなエンターテインメントに関わる人間も一緒に手を携えて、日本からビジネスモデルを変えていく。そんな新しい事業を一緒にさせてもらえることを、大変うれしく思っています」

 また司会の春日氏は、自身もVOICENCEパートナーであるほかに、KizunaAI氏のボイスモデルとしてもVOICENCEに参加している。そんな春日氏は、VOICENCEのデモンストレーションに先立って「今日はVOICENCE搭載モデルのアイちゃん(KizunaAI氏)と初めてお話できるということで、とてもわくわくしています」と期待を話す。

 そしてデモンストレーションでは、KizunaAI氏の声を基に作成した生成AI音声が使われた。まずは音声印象制御技術の実演として、基準となる「Basic」、Basicよりも元気が良い「High」、淡々とした「Low」の3種類の音声が流れた。春日氏はこの音声を聞き「AIといえば淡々としたイメージだったんですが、こんなに感情豊かな表現ができるんですね」と驚きを示す。

 続いては多言語合成技術の実演として、KizunaAI氏と別所氏で英語での会話が行われた。実際に会話をした別所氏は「(VOICENCE搭載モデルのKizunaAI氏は)トントントンと答えてくれましたね」と、会話のスムーズさに感心した。

別所哲也氏(写真左)とKizunaAI氏(写真右)。VOICENCEの多言語合成技術を聞いた別所氏は「実演家が各国の言葉で伝えることで、海外のファンもうれしいんじゃないですかね」と語る。

 デモンストレーションに続いて、花城氏、別所氏、春日氏、ワタナベエンターテインメントの顧問を務める中井秀範氏、NTT 社会情報研究所 研究員 荒岡草馬氏の5者によるパネルディスカッションが開催された。

写真左から春日 望氏、別所哲也氏、中井秀範氏、荒岡草馬氏、花城高志氏。

 パネルディスカッションでは、声の未来をどう守りどう生かしていくかをテーマに5者が意見を交わした。このテーマを受けて中井氏は、自身の経歴を交えながら、VOICENCEに対する考えをこう話す。「私は10年間ほど、日本音楽事業者協会という、日本の芸能事務所で構成される業界団体の専務理事を務めていました。その時に音楽や肖像など、パブリシティ系をなんとかして法制化しようと頑張っていました。しかしAIの登場により、法律ができたころにはもう、テクノロジーが先に行き過ぎて法律が役に立たないんじゃないかという状況になったんですね。そこでいろいろ悩んでいるときに、NTT西日本さまがVOICENCEを始めるというお話を聞きました。さらにVOICENCEを始めるに当たって、ガイドラインを作りたいというお話もいただきました。これを受けてとても良い試みだと思いましたので、VOICENCEには非常に期待しています」

 続けて荒岡氏は、NTTの社会情報研究所が進める、声の保護に関する取り組みを次のように語る。「NTTの社会情報研究所では、声の権利の法的な側面からの検討とルールメイキングを進めています。声自体には権利性が認められておらず、法律もなく、裁判所の判例もないのが現状です。これにより、無断で声を使われた側が権利主張できない問題はもちろん、事業者が音声サービスを展開する際、アウトの基準が明確に定められていない課題もありました。そこで我々は、諸外国の動向調査、有識者との意見交換、一般・専門家への調査などを通じて、声の権利を明らかにすることを進めています。今は社内向けの解説資料をNTTグループに展開していますが、今後は業界ガイドラインとして展開ができればと考えています」

 発表会の最後には、花江夏樹氏がVOICENCEのローンチに向けて以下のようにコメントを送った。「声の仕事をしていて感じるのは、海外の方から反応をいただく機会がすごく増えているということです。反応をいただくたびに、声には国境を越えて届く力があるのだと感じます。今回、VOICENCEで海外の皆さまにも、その方の国の言葉でメッセージを届けられることにわくわくしています。声を正しく守りながらテクノロジーを通じて、新しい届け方を作っていく取り組みに可能性を感じ、私もVOICENCEに参加することにしました。声がもっと自由に、もっと遠くまで届く未来が広がることを楽しみにしています」

VOICENCEパートナーの花江夏樹氏も、映像を通してVOICENCEにメッセージを送った。
発表会の会場にはVOICENCEを体験できるデモが用意されていた。参加した記者たちは、短い言葉を話すだけで自らの声のAI音声が作成されることに驚いていた。