世界最高峰の音声合成技術で多領域の事業展開に挑むーテクノスピーチ大浦氏にインタビュー #NALIC特集

投稿者: | 2018-04-10
Pocket

中小機構が運営する名古屋医工連携インキュベータ、その名も「NALIC (ナリック)」。このNALICでは、産学連携のR&Dを中心とした愛知県内の医療・工学系ベンチャーが、数多く入居しています。NALIC特集第1弾は、名古屋工業大学発ベンチャー企業のテクノスピーチが登場です。今回は同社代表取締役の大浦氏に取材をさせて頂き、起業までのプロセスと進展中の事業についてお答えしてもらいました。

大浦 圭一郎 氏|プロフィール

1982年、愛知県出身。名古屋工業大学大学院博士後期課程在学中に音声合成の研究をする傍ら、株式会社テクノスピーチを創業。卒業後、研究員として同大学の音声合成の研究に携わる。2017年度より同大学院特任准教授に就任。

名工大在学中に開発したオープンソースの音声合成システムをきっかけに起業

若目田:大浦さんはずっとアカデミックの世界にいたと思うんですけど、起業までの過程について伺ってもいいですか?

大浦:おっしゃる通り、元々は名古屋工業大学で音声合成に関わる研究をずっとしていたんですよね。音声合成というのは、文字を音声に変換する技術のことです。

在学中にオープンソースの音声合成システムを開発して、無料で全世界に公開していました。その時にかなり反響があって、大手メーカーでも採用して頂いて…。その音声合成システムが、一種のデファクトスタンダードになったんです。

若目田:そんなに反響があったシステムを、どうして無償提供していたんですか?

大浦:個人の方から企業、大学の方にまで使って頂けるようになって、このシステムを開発しているのはどこなのかと。その時に、名古屋工業大学の名前が挙がるわけです。すると、研究拠点としてのステータスが上がり、共同研究などで外部資金を導入できる。世界の最新技術をどんどん使えるようになるんです。いわゆる、オープンソース戦略です。

一方で、このソフトウェアは研究開発用なので、技術者の方やスペシャリストがいないと、簡単には使いこなせないという問題がありました。このオープンソースのアルゴリズム自体は統計モデルなので、もっといろんなことが出来ると伝えたかったのです。

若目田:具体的には、どんな特徴があるのでしょうか。

大浦:この音声合成システムの特徴は大きく2つあります。

1つ目は、多様な音声を容易に実現にできること。2つ目は、省リソースで携帯デバイスでもシステムを動かすことが可能だということです。

この省リソースである点に注目して、カーナビなどの音声機能に導入する企業は多くありました。従来の波形を接続する形の技術ではシステムが巨大になりすぎてしまうので、魅力的に思って頂ける企業さんは多かったんです。

でも、一番の肝、多様な音声を容易に実現できる点で、このシステムを利用して開発をした会社があまり無かったんです。せっかく自分たちで世界で戦えるシステムを作ったのに、そのアルゴリズムのパワーを見せつける機会がなかった…。それがきっかけで起業しました(笑)

若目田:その言葉から、大浦さんのシステムへの思い入れを強く感じます。

エンタメ業界を中心に音声合成システムを事業化

若目田:テクノスピーチのシステムを使う企業や業界は、どんなところが多いんですか?

JOYSOUNDでの活用例

大浦:分野として、エンタメ業界が多いですね。名古屋ですと、エクシングさん。JOYSOUNDの歌声合成器に、弊社の音声合成システムを使って頂いています。

若目田:我々の身近でも使われているんですね。

大浦:あとは、CeVIOプロジェクトですね。これは複数の企業で音声創作ソフトウェアの販売をするプロジェクトなんですけど、この根幹システムを開発しました。

大浦:これを応用して、「ハルオロイド・ミナミ」も開発しました。これは、故・三波春夫氏の声を再現した、テイチクエンターテイメントさんらのプロジェクトです。

若目田:どれも著名なプロジェクトで利用されているんですね。

「名工大発ベンチャー」というアドバンテージ

若目田:大浦さんのお話を聞いていると、R&Dとは思えないスピード感と市場感覚で事業を進めていると感じます。

大浦:ありがとうございます。やはり、名工大発ベンチャーであることがアドバンテージになっているのだと思います。

名古屋工業大学は、音声合成技術の世界有数の研究拠点の1つです。そこと太いパイプを持っている点は、技術面において信頼度はかなり高い。

また、通常の研究開発の後の製品化って、やっぱり遅いんですけど、それを短いスパンできるのは、ベンチャーの強みですよね。

アルゴリズム組んで、実証実験をして、論文を書いて、プロトタイプ作って…。なんだかんだ3年、いや5年以上はかかるんですよ。なので、今の環境は本当に恵まれているなと思います。

介護・医療・教育の分野でも展開

若目田:今後テクノスピーチの音声合成システムがどのように活用されていくのか、楽しみですね。

大浦:ありがとうございます。エンタメだけでなく、介護・医療・教育の分野で応用する予定です。

実際に今後に向けて動いている企画もあって、例えば介護だと、エクシングさんの介護施設向け対話アプリ「健康王国 for Pepper」ですね。

医療領域では、病気で声帯を失った人の声を再現することなんかに応用できるのではと思います。感情も表現できるので、患者さんや家族の方の精神的な支えにもなります。

教育分野では、音声合成機能を利用した語学学習が出来るんじゃないかなと考えています。

若目田:自分が英語が上手くなった時の発音や声を再現できれば、より学習のモチベーションにも繋がりますよね。

大浦:その通り。このように、音声合成の技術はありとあらゆる業界・職種で利用可能なんです。テクノスピーチの技術を使って一緒にビジネスをできないか、気になる企業の方は是非ご連絡して頂ければと思います。

編集部まとめ

日本でも有数の音声合成技術を持ち、多角的に事業展開を進めるテクノスピーチ。大浦氏のインタビューを通して、この分野の市場の可能性を感じることができました。

NALICでは、テクノスピーチのように愛知県内で注目されているR&Dベンチャーが多数入居しています。同じ領域でお仕事されている方は、お時間のある時にぜひ足を運んで見てはいかがでしょうか。