インタビュー

日本中に「声」の魔法を。AI音声認識の開拓者が語る、逆境を成長に変えるゴール思考の極意

PROFILE
株式会社アドバンスト・メディア 代表取締役会長兼社長
鈴木 清幸

29年前、まだ誰も「音声認識」なんて言葉を意識していなかった時代から、この分野を切り拓いてきた人がいます。株式会社アドバンスト・メディアの代表取締役会長兼社長、鈴木清幸さん。

京都大学を中退して実業界へ。アメリカでの買収劇や経営危機など、波瀾万丈の道のりを「ゴール思考」で突破してきた鈴木さんに、これまでの歩みと、AIが日常に溶け込むこれからの展望についてお話を伺いました。

逆境を「ゴールが駆動する耐動」で突破する

京都大学への現役合格と、あえての「中退」

私は愛知県の小牧長久手の戦いの舞台となった長久手で育ったんですが、中学の頃にはもう「京都大学に行く」と決めていたんです。東大ではなく京大。昔からゴール思考が極めて強くて、自分で目標を定めてそこへ向かって自分を追い込んでいくのが特性だったんですよね。

大学では数学や物理に没頭して、博士課程まで進みました。そして、博士課程を、2年で中退したんです。 なぜならば、私の研究を実証するためのデータが大学にはなかったから。複雑な現象を数式で表現する面白さを、もっと現実の世界で試したいという思いもあり実業界に飛び込んだのです。

AIへ挑戦

その後、1985年アメリカで第二次AIブームが起こり、私はその可能性に魅せられて渡米し カーネギーメロン大学発のベンチャーに関わることになったんです。そのベンチャーとの連携により日本でもAIブームを起こそうと約12年間奮闘したのですが、見事に失敗しました。ですが、それが、「音声認識の市場開発」へと導いたのです。

 

音声認識の市場開発へ

1997年に株式会社アドバンスト・メディアを創業するわけですが、音声認識で既に定評を博したカーネギーメロン大学に集結した技術者集団を仲間に引き入れ、日米同時の音声認識の市場開発を始めることができました。日本でAIを流行らせられなかった男がリベンジとして選んだのが「音声認識の市場開発」だったわけです。当時、AIへの指令をキーボードに頼るしかなかった現実に気づき、非不効率なキーボード入力を音声による自然なコミュニケーションに変えるビジネスを考えました。そのために、当時、日本ではまだ実績が少なかった直接金融による資金調達に挑戦して大きな資金を手に入れることで、技術開発や市場開発に重要な仲間づくりができたのでした。

 

予期せぬ買収劇、MBOによる再出発

2000年に、弊社と同じく1997年に米国で創業した仲間であるパートナー会社が、米国で急成長した音声認識のベンチャー企業に買収されてしまいました。私にとっては、まさにピンチじゃないですか。でも、直接金融で得た資金を有効に機能させ、 MBO(マネジメント・バイアウト)により、そのパートナー会社を人や技術ともども手に入れることができました。そして、10年後には時価総額を40倍に高め、 株式を売却してさらに大きな資金を得ることができたのでした。これは、弊社のピンチをチャンスに変えて会社を強くするという特性の一例です。 

 

「顧客の都合」から始まる音声認識の民主化

なぜ医療現場からスタートしたのか

創業当時、音声認識をどこで使ってもらうかは大きな課題でした。そこで目をつけたのが医療分野です。コンピュータへの入力手段であるキーボードは英語圏の発明であり、日本人にとっては非効率な入力手段でした。PCを活用するドクターについても然り。

「声で入力できれば、もっと患者さんと向き合える」。この「顧客の都合」に徹底的に寄り添ったのが、弊社のAI音声認識「AmiVoice」の原点です。まずは必要性が高く、対価を払っていただけるプロフェッショナルな現場から浸透させていく。これが私たちの勝ち筋でした。

これは米国においても、10年間で時価総額を40倍にさせてくれました。医療分野に特化し、 彼らを提供者視点から病院という利用者側の視点、すなわち、「顧客の都合」を考えて動くように変えたのです。つまり、顧客が「利用を始め」、「利用し続け」、そして、それが「ないと困る」ようにする道筋を考えさせ、そのステップを着実に上らせたのです。この考えとその着実な実行が日本でも通用し、「音声認識がアタリマエ」が見えてきた現在があると思っています。

 

巨大テック企業に「蹴散らされない」強さ

今やGoogleやMicrosoftといった世界の巨人が、音声認識市場に参入しています。ですが、私たちはシェアNo.1 (※1) を維持し続けている。それは、単に技術を売るのではなく、現場の課題を解決するソリューションとして磨き続けてきたからです。

例えば、物流や建設の現場。騒音がある場所で、手が離せない作業員がどうすれば正確に音声入力できるか。コールセンターであれば、お客様との通話内容をリアルタイムでテキスト化し、どのようにオペレーターの応対を支援するか。こうした現場の業務にあわせた最適化こそが、私たちの真骨頂なんですよね。

 

「音声AIの市場開発」により新たな未来を

29年を経て、いま再び勝負の時

私たちは今、2027年3月期に売上高100億円という目標の達成を目指し、成長を続けています。この目標は次の大ジャンプに向けてのステップと考えています。その大ジャンプとは何か?それは、29年間の音声認識の市場開発の体験を経て踏み出す「音声AIの市場開発」です。これは、第三次AIである生成AIやAIエージェントに、第二次AIを進化させた弊社独自のパーソナライズAI(※2)を連携させることで、 仕事の効率や効果を高める「働く環境」を世に提供し、新たな経済圏をつくるというものです。今また、次の挑戦を始めようとしています。

「GAP」を若者たちへ

私がこれまでやってこられたのは、GAPの能力とこの能力を磨き続けてきたからです。GAPとは「ゴールが駆動する耐動」、すなわち、ゴールからの乖離(ギャップ)を埋めるトライ&エラーを失敗などに耐えてやり続けることをいいます。GAPは、英文の “Goal-driving Actions with Perseverance”の頭文字で作った造語です。テニスでも全国大会での優勝を経験しましたが、それも受験も同じ。ゴールからの乖離という失敗の原因を考え、それを埋めることを限られた時間の中でやり続け、どう結果を出すか。学生の皆さんには、ぜひ自分なりのゴールを見つけてほしいですね。完璧に整った道なんてない。失敗してもいいから、自分で決めた目標に対してどれだけ純粋に向き合えるか。そして、失敗からいかに貪欲に学びを得られるか。その熱量が、新しい市場や新しい自分を作っていくんだと思います。

 

編集後記

今回、鈴木会長にお話を伺い、最も印象に残ったのは「ピンチをチャンスに変える圧倒的なエネルギー」でした。ビジネス未経験の私にとって、数億円単位の買収や経営危機は想像を絶する世界ですが、それを「面白い」と語る会長の姿勢に、プロの経営者としての凄みを感じました。

特に学びになったのが「顧客の都合を考える」という視点です。どんなに優れたAI技術があっても、それを使う人の不便さを解消できなければ意味がない。これは、将来どんな仕事に就く上でも忘れてはならない本質だと自分なりに解釈しました。

既存のレールに乗るのではなく、自分の目的のために最短距離を選ぶという意思の現れで、就職活動を控えた自分にとって、自分の軸を持つことの大切さを改めて学ぶ機会となりました。

 

※1出典:合同会社ecarlate「音声認識市場動向2026」音声認識ソフトウェア/クラウドサービス市場

※2 パーソナライズAI(Personalize AI)とは、音声AIイネイブル(音声を利用可能とするAI)を特長とした、利用企業や利用者個別の目的のために、所有する非公開データなどを使った学習やカスタマイズにより出力の品質や正確性を担保し自分のものにできるAIのこと。