2022年11月にOpenAIが発表した対話型AI「チャットGPT」が広く世の中に浸透するにつれ、生成AIや大規模言語モデル(LLM)への関心が高まってきています。多くのスタートアップが参入し、大量の資金が投入され、ユニコーンも登場しています。
本記事では世界で注目されている生成AIのスタートアップ、特にユニコーンとして期待されている企業をご紹介します。
生成AIのユニコーン18選
2024年におけるトップクラスの生成AIユニコーン企業の一覧を紹介します。全て革新的な技術と大規模な市場影響を持つスタートアップになります。AIの最前線で革新を続けることにより、その評価額が10億ドルを超える「ユニコーン」としての地位を確立しています。これらの企業は、多言語モデル、カスタマイズ可能なAIソリューション、高度な自律型AIなど、さまざまな領域で突出した成果を上げており、2024年のAI技術動向に大きな影響を与えています。
【中国】月之暗面(Moonshot AI)|AIアシスタント「Kimi」
中国のAIスタートアップ「月之暗面(Moonshot AI)」は2023年3月に設立され、中国の大規模言語モデル(LLM)分野で注目されています。その主力製品であるAIアシスタント「Kimi」は、多機能AIアシスタントとして漢字200万文字を超える長文入力に対応していることで知られています。主な機能は以下になります。
- 対話: ユーザーとの自然な対話が可能で、質問に答えることができます。
- ファイル解析: テキスト、PDF、Word、PPT、Excelなどのファイルをアップロードし、その内容を解析して回答します。
- インターネット検索: 必要に応じてインターネットを検索し、情報を収集して回答します。
- モデルのカスタマイズ: Kimi+機能を通じて、特定のニーズに応じたモデルのカスタマイズが可能。
最近の資金調達ラウンドで評価額が30億ドル(約4,700億円)に達しました。このラウンドにはテンセントと高榕創投(Gaorong Ventures)などが新規出資者として参加しました。
以前の資金調達では、アリババグループと礪思資本(Monolith Management)から合計8億ドルの出資を受け、評価額は25億ドルに達していました。月之暗面は、紅杉中国(HongShan)、今日資本(Capital Today)、真格基金(Zhen Fund)、美団傘下の龍珠資本(Dragonball Capital)、小紅書(RED)など、少なくとも20の有力な投資家から支援を受けています。
【カナダ】 コーヒア|Command R+ 多言語AIモデル
カナダのスタートアップ企業Cohereは、自社傘下の非営利研究組織を通じて、101言語に対応した大規模言語モデル(LLM)をオープンソースで提供すると発表しました。この取り組みは、特に従来AIが対応していなかった少数言語の話者に対する生成AIの利用を促進することを目的としています。以前のオープンソース型LLMは最多で50言語対応でしたが、Cohereの新モデルはそれを大幅に上回ります。
Cohereは3,000人を超える独立した研究者と連携し、少数言語の大量のデータを収集しました。このデータとLLMは、外部の企業や研究者が自由に使用できるよう公開されています。同社は、計算能力の要求が少数言語のAI開発の障壁になっていると指摘しています。
企業向けに生成AIの機能を提供しているCohereは、特にビジネス用途で需要の高い英語などに強みがあります。新しいオープンソースのLLMは精度は低いものの、より多くの言語を網羅している点で特徴があります。Cohereは非公開の主力技術を用いたサービスで収益を上げつつ、研究力を高めるためにオープンソースの取り組みも行っています。
2023年には米エヌビディアや米オラクルから2億7,000万ドルを調達し、米オープンAIの競合として注目されています。また、2024年4月4日には「最も強力でスケーラブル」と位置づける新しいLLM、Command R+を発表しました。このモデルはエンタープライズ用途に特化しており、前年3月に発表されたCommand Rと同様、12万8,000トークンのコンテキストウィンドウを特徴としています。Command R+には、ハルシネーションを減らすためのインライン引用機能や検索拡張生成(RAG)、10カ国語に対応し、グローバルビジネスを支援する高度なビジネスプロセス自動化ツールが備わっています。
さらに、CohereはMicrosoftとの新たな提携を発表し、MicrosoftのMaaS(Models as a Service)の一部としてCommand R+がAzure AIモデルカタログに統合されました。この統合により、Command R+はMicrosoftのプラットフォーム上で広くアクセス可能となり、Cohereは自社ブログでCommand R+の価格性能比の高さを強誰するグラフを共有し、他の基盤モデルとの比較を行っています。
【アメリカ】 コグニションAI|自律型AIエンジニア「Devin」
米Cognitionは、革新的なAI技術を開発する企業であり、特に自律型AIソフトウェアエンジニア「Devin」の開発で知られています。このAIは2024年に発表され、コーディングやコンソール操作を自動で行い、生じるエラーも自律的に解決する能力を持っています。Devinは、プログラムの構築やレビューなどの必要なタスクを独立して完了できるため、エンジニアリングチームがより複雑で興味深い問題に集中できるよう支援します。
Devinは、サンドボックスコンピューティング環境内で動作し、シェル、コードエディタ、ブラウザなどの開発者ツールを備えています。また、リアルタイムでの進捗報告やフィードバックの受け入れ、ユーザーとの設計上の協力が可能です。このAIは、SWE-benchの評価で前の最先端技術よりもはるかに高い成果を示しており、課題の13.86%をエンドツーエンドで正しく解決しています。Devinの利用を希望する場合は、早期アクセスの待機リストへの登録が必要です。
このような高度な自律型AI技術により、米Cognitionはエンジニアリングの自動化と効率化を推進し、AI分野でのイノベーションを牽引しています。
【フランス】 ミストラルAI|欧州版オープンAI
Mistral AIは、2023年にフランスで設立されたAIスタートアップで、MetaとGoogle DeepMindの元従業員が中心となっています。この企業は、高度なAI技術を駆使して、様々な言語モデルを開発し、特に大規模言語モデル(LLM)の領域で革新を進めています。主にオープンソースのアプローチを取っており、そのモデルは自由に利用や再利用が可能です。これにより、企業や研究者は独自のAIソリューションを容易に構築できます。
Mistral AIの主な特徴と提供するモデルは以下の通りになります。
【MoEアーキテクチャの採用について】
Mistral AIは、Mixture of Experts(MoE)アーキテクチャを採用しています。これは、複数の専門モデルを組み合わせ、必要に応じて最適なモデルを動的に選択することで、計算効率と性能を高める技術です。
【オープンソースモデル】
■Mistral 7B: 7.3Bパラメータを持ち、英語とコード生成に特化しています。
■ Mixtral 8x7B: 46.7Bパラメータを持ち、Sparse Mixture of Experts(SMoE)アーキテクチャを使用して効率的に動作します。
■Mixtral 8x22B: 141Bパラメータを持ち、多言語対応と高度なコーディング・数学タスクに適しています。
【商用モデル】
■Mistral Small: 簡単なタスクに適しており、複数言語に対応。
■Mistral Large: 高度な推論と専門的なタスクに特化しており、フラッグシップモデルです。
■ Mistral Embed: 英語のテキストから特徴を抽出するモデルです。
Mistral AIには以下のような活用方法があります。
【コンテンツ生成について】
ブログ記事、ソーシャルメディア投稿などを自動生成します。
【カスタマーサポートの自動化について】
チャットボットを構築し、顧客からの問い合わせに自動で応答します。
【マーケティングキャンペーンについて】
パーソナライズされたマーケティングメッセージの生成を行えます。
【多言語対応について】
ドキュメントの翻訳や多言語チャットに対応しています。
【市場調査や競合分析について】
ビッグデータの処理とインサイト抽出します。
利用開始するには、Mistral AIのプラットフォームからAPIキーを取得し、外部アプリケーションやサービスからモデルにアクセスします。
Mistral AIは、その革新的な技術とオープンソースのアプローチにより、幅広い業界でのAI活用を推進し、特に開発者や企業に対して柔軟かつ強力なツールを提供しています。
【アメリカ】 Runway|動画生成AIモデル テキストから画像を生成
Runwayは、テキストベースの指示からアート作品や販促用コンテンツの画像生成を得意とするアメリカのスタートアップ企業です。この企業は、画像生成分野で特に影響力があり、他の競合を圧倒しています。
広範囲な用途に技術を提供するRunwayは、企業のアバターやリアルなディープフェイク画像も生成。これらの技術は業務支援ツールとして機能し、「新しいPhotoshop」との評価を受けています。Runwayの革新的な生成AIは、視覚メディア生成において重要な役割を果たしています。
また、2億3,700万ドルの資金調達に成功したRunwayは、技術開発と市場地位の強化を進めています。
2023年11月に試験公開された「Motion Brush」は、画像から動画を生成する技術です。このツールを使えば、ユーザーは動かしたい対象をブラシで塗りつぶし、移動方向を指示するだけで、わずか1分で4秒間の映像を生成できます。この技術は、影の動きや部分的な変形を含む映像生成にも対応しています。
Runwayは2018年にアナスタシス・ジャーマニディス(CTO)、クリストバル・バレンズエラ(CEO)、アレハンドロ・マタマラ(デザイン部門責任者)によってニューヨークで設立されました。同社は「Gen1」と「Gen2」の2つのAIモデルを技術の核とし、これらに基づく編集ソフトをサブスクリプションサービスで提供しています。Gen1は既存の動画から新たな動画を生成し、Gen2はテキストから動画を生成します。
Runwayの顧客層は大幅に増加し、CBSのコメディ番組や音楽ビデオ、広告会社などで広く採用されています。映画スタジオもこの技術を制作前の構想段階で使用しており、2023年12月4日にはGetty Imagesとの提携を発表し、新たなAIモデルの開発にも着手しています。
【イスラエル】 AI21ラボ|Wordtune Spices 文章作成支援ツール
テルアビブに本拠を置くAI21 Labsは、2023年1月17日に「Wordtune Spices」というジェネレーティブAIを用いた文章作成支援ツールをリリースしました。このツールはユーザーが12種類のキューから選択することで、論拠を補強する統計データや、具体的な提案を文章に加えることが可能です。また、創造的な表現や心に響く引用を加える機能も含まれています。
AI21 Labsのアプローチは、大規模な言語モデルに依存するだけでなく、出典元へのリンクを提供することで情報の透明性を保ちつつ、正確な内容の生成を目指しています。これにより、既存の大規模言語モデルが抱える著作権や情報信憑性の問題を解決しています。
同社の創業者であるオリ・ゴシェン氏によると、AI21 Labsは「書き手を支援することを目指し、書き手に取って代わることなく、彼らの表現を自由に行えるようにする」ことを使命としています。また、ゴシェン氏は、以前にクラウドファンディングプラットフォーム「CrowdX」を設立した経験もあります。
AI21 Labsは、大規模な言語モデルよりも「精度を重視する」という方針を採り、言語モデル「Jurasic-1」を基盤にして、推論や知識表現を強化することで、一般的なディープラーニングモデルの限界を超えることを目指しています。これにより、言語モデルが実世界のデータと連携し、時代遅れの情報に基づく誤った答えを出さないようにしています。
AI21 Labsは、「AI21 Studio」を通じて開発者にAPIアクセスを提供し、NLPをサービスとして提供しています。これにより、開発者はテキストベースのアプリケーションの開発や、非構造化テキストの分析など、AIを利用したさまざまなソリューションを構築できるようになります。
【アメリカ】 トゥギャザーAI|AI開発基盤
Together AIは、生成AIインフラ市場で注目を集めるアメリカのIT企業です。2022年に創業され、わずか2年後の2024年にはシリーズAの資金調達で1億600万ドルを獲得し、企業価値を13億ドルにまで高めました。Together AIは開発者に向けて生成AIモデルの構築やカスタマイズが可能なプラットフォームを提供しており、2024年3月時点で45,000人の開発者が利用しています。
この企業は、特にモデル開発の分野で急速に成長しています。彼らは新たな応用可能性を探り、地域の言語対応モデルの開発などに力を入れています。また、パラメータ数を「GPT-3.5」の88分の1に抑えることで、より軽量で学習スピードが速く、エッジデバイスでの運用が容易なモデルを開発しています。これは、金融サービスや医療・ヘルスケアなどのデリケートなデータを扱う業界にとって、データプライバシーを守りながら高性能なAIソリューションを地元で運用する可能性を提供します。
Together AIは、Vipul Ved Prakash氏によって共同創設されました。彼は以前Appleに買収されたTopsyの創業者でもあります。Together AIのプラットフォームは、Llama-2、RedPajama、Falcon、Alpaca、Stable Diffusion XLなどのオープンソースモデルを統合しており、開発者はAPIを通じてこれらのモデルを簡単にカスタマイズまたは実行できます。
Vipul Ved Prakash氏は、現在のクラウド製品が提供する閉鎖的なソースモデルではなく、よりオープンでカスタマイズ可能な生成AIソリューションの必要性を指摘しています。
【中国】 ミニマックスAI|ソーシャルAI
MiniMaxは、中国のAI分野で注目される新興企業であり、特に大規模言語モデル(LLM)の開発に力を入れています。この企業は、2021年に商湯科技(SenseTime)の元幹部によって設立されました。MiniMaxは、テキスト、音声、画像を処理する高度なマルチモーダルAI技術を有しており、それにより多様なアプリケーションでその技術が利用可能です。
最近、MiniMaxは「abab 6.5」シリーズという新しいモデルをリリースしました。このシリーズには「abab 6.5」と「abab 6.5s」の2種類があります。abab 6.5は1兆パラメータを持ち、20万トークンのテキストを処理できる能力を持っています。一方でabab 6.5sはより効率的な処理を行い、約3万字の長文テキストを1秒以内で処理することが可能です。これにより、複雑なテキスト処理能力が大幅に向上しています。
MiniMaxはこれらの技術を活用して、カスタマーサービス、ライティング、翻訳などの分野での応用を模索しています。また、パートナー企業と協力し、より便利で効率的なサービスを提供する方針です。
2024年3月には、アリババグループから6億ドル(約930億円)を超える資金を調達し、企業の評価額は25億ドル(紈3,900億円)を超えるまでに成長しました。この資金調達は、MiniMaxが市場での位置づけを強化し、更なる技術開発を進めるための重要なステップとなっています。
【アメリカ】 イレブンラボ|AI音声基盤学習モデル
Eleven Labsは、自然な音声合成とテキスト読み上げソフトウェアを開発するアメリカのソフトウェア会社です。彼らの主要製品には、28言語に対応したAI音声基盤学習モデル「Multilingual v2」があります。このモデルは、高品質のイントネーションとペースを保ちながら、感情豊かなAIオーディオを生成できるため、ユーザーが自分の声の完璧なデジタルコピーを再現することも可能です。
Eleven Labsの技術は、世界中のクリエイターがローカライズされたオーディオコンテンツを制作できるよう支援しており、特にヨーロッパ、アジア、中東の市場向けにサービスを提供しています。彼らのプラットフォームは、テキストを自動的に識別し、信頼性の高い音声を生成する能力を持っています。
2023年1月にはベータ版をリリースし、その後100万ユーザーを超える登録者を獲得しています。さらに、シリーズAラウンドで1,900万ドル(約27億円)を調達し、プラットフォームのアップデートを行いました。また、彼らは深層学習を利用した著名人のなりすましや悪用といった問題にも積極的に取り組んでおり、AI Speech Classifierを通じて生成された音声が含まれているかを判定できる技術を公開しています。
CEOで共同創設者のマティ・スタニシェフスキーは、すべてのコンテンツをあらゆる言語でアクセス可能にするというビジョンを持っており、新しい「Multilingual v2」リリースにより、この目標に近づいたと述べています。彼らはAIを活用してさらに多くの言語と音声をカバーし、言語の壁を取り除くことを目指しています。
【アメリカ】 Perplexity AI|AI検索
Perplexity AIは元GoogleのAI研究者たちが設立した米サンフランシスコ発の生成AI系スタートアップでわずか1年で評価額750億円に達し、注目されています。
2024年6月17日、ソフトバンク株式会社は注目を集めるPerplexity(パープレキシティ)社と戦略的提携をしたことでニュースになりました。検索がグーグルからパープレキシティに変わるとも言われるほど、広く影響力を持つとも言われています。
Perplexity AIは、Googleが支配する検索市場にAIを活用して挑戦しており、特にウェブインデックスと最新情報を会話型AIチャットボットインターフェースで組み合わせた独自の大規模言語モデルの開発によって高い評価を受けています。アプリは基本無料でiOSおよびAndroidで利用可能で、使用者数が順調に増加しています。また、Perplexity AIは、ユーザーに対してインタラクティブな検索体験を提供し、複雑なトピックについても効果的に情報を提供します。
さらに、Perplexity AIは、OpenAIの「GPT-4」やAnthropicの「Claude 2」などの既存の大規模言語モデルを活用していましたが、最近では自社開発のモデル「pplx-7b-online」と「pplx-70b-online」もリリースしています。これらの新モデルは、それぞれ70億と700億のパラメータ数を持ち、特に有料ユーザーに多様な選択肢を提供しています。
Perplexity AIの無料版は「GPT-4」を利用し、4時間ごとに5件の検索制限がありますが、20ドルの月額プランでは1日300回以上の検索が可能です。また、公式サイトは英語表記ですが、チャットボットは日本語を含む多言語で問題なく使用可能で、回答が英語で返ってきた場合は、AIによる機械翻訳を指示することができます。
Perplexity AIは、最新の情報提供を目指し、情報の出典も明示しています。これはGoogleのGeminiなど他の生成AIが批判される中で、Perplexity AIの透明性と信頼性を高める要因となっています。また、検索に「Focus オプション」を使用することで、情報源を限定し精度の高い回答生成が可能です。
Perplexity AIの進化とその独自のアプローチが注目されており、GoogleやChatGPTといった既存の大手との競争においてもその地位を確立しつつあります。
【インド】 クルトリムAI|インド発ユニコーン第1号
Kultrim AI (クルトリム・SI・デザインズ) は、インド南部ベンガルールに本拠を置く新興の生成人工知能スタートアップです。同社は2023年4月に創業され、共同創業者のバビシュ・アガルワル氏によって率いられています。アガルワル氏は以前にも配車サービスアプリ「Ola」や電動二輪車製造の「Ola Electric」を創業しており、いずれもユニコーン企業に成長しています。
2024年には、米国系ベンチャーキャピタルのマトリックス・パートナーズ・インディアなどから5,000万ドルの資金調達を成功させ、企業価値が10億ドルを超え、新規インド発ユニコーン第1号となりました。これはインドのAI開発企業としては初の快挙です。
Kultrim AIは独自の大規模言語モデル(LLM)を開発しており、インドの22言語から情報を習得し、10言語で文章を生成できる能力を持っています。これにより、インド国内外での多言語対応サービスを提供し、広範なユーザーベースにアクセスすることが可能です。
インドでは、生成型AI技術のスタートアップは70社以上が存在するものの、国際的な影響力では米国のOpenAIなどに及ばない状況です。しかし、インド政府は生成AI技術の法規制導入を否定し、国内開発の促進を意図していることが見て取れます。この政策は、技術革新と国内外からの投資を引き寄せる環境を整える狙いがあります。
新型コロナ禍を経て、インドでは多くのスタートアップが大型資金を調達し、数多くの新ユニコーンが誕生しましたが、最近の経済状況の中でユニコーン企業の新規登録は減少しています。Kultrim AIの成功は、このような困難な状況の中でも顕著な成果と言えるでしょう。
【中国】 零一万物(01.AI)|中国版ChatGPT
零一万物(01.AI)は、台湾生まれの李開復氏が創設した中国のスタートアップ企業です。零一万物は「Wanzhi」という自社初の消費者向けAIアシスタントを発表しました。このアプリは、Microsoftの「Office 365 Copilot」に似ており、ユーザーがスプレッドシート、文書、プレゼンテーション用スライドを迅速に作成するための支援を行います。さらに、財務報告書の解読や会議の議事録作成、長編書籍の速読など、幅広い機能が含まれています。
このアプリは中国語と英語で利用可能です。李氏は中国では、米OpenAIのChatGPTのような対話型AIが禁止されているため、中国独自の「ChatGPT」が必要だと考え、中国市場向けに主に展開しています。
零一万物はまた、企業ユーザー向けに「Yi-Large」という独自の大規模言語モデル(LLM)も導入しています。李氏は台湾出身で、米AppleやGoogleでの勤務経験があり、10年以上前に自らのベンチャーキャピタルを設立しました。零一万物は設立後8カ月で企業価値が10億ドルを超えるユニコーン企業に成長し、シリコンバレーの一部指標を上回るオープンソースAIモデルを武器にしています。
中国のテック企業が生成AIの分野で米国企業に追いつくために懸命に取り組んでいる中、零一万物はその先駆けとなるポテンシャルを持っています。
【中国】 百川智能 (BAICHUAN AI)|AIモデル
百川智能(バイチュアンAI)は、2023年4月に創業された中国のAIスタートアップで、創業者は元ソーゴウCEOの王小川氏です。この新興企業は創業からわずか半年で、中国の大手企業であるアリババ、テンセント、シャオミからの支援を受け、3億ドル(約449億円)の資金調達に成功しました。この資金調達により、百川智能は企業価値が10億ドルを超え、ユニコーン企業の仲間入りを果たしました。
百川智能は主に大規模言語モデル(LLM)の開発に注力しており、無料で利用できるオープンソースのLLMとクローズドソースのLLMを提供しています。この会社はAPIを通じて企業間ビジネスの商用化を進めており、170人以上の従業員の大部分が研究開発に従事しています。従業員はソーゴウ、百度、バイトダンス、マイクロソフトなどの著名企業から集められた優秀な人材です。
中国のIT業界では生成AIの開発競争が激化しており、大手企業も積極的にLLMを自社サービスに組み込んでいます。この中で百川智能がどのような独自の優位性を発揮できるか、創業者の王小川氏の手腕に注目が集まっています。
【中国】 智譜AI(Zhipu AI)|AIモデル
智譜AI(Zhipu AI)は、2019年に清華大学のコンピューターサイエンス・テクノロジー学科の知識工学実験室がインキュベートした中国の注目されるAIスタートアップです。この企業は最近、中国コンピュータ大会(CNC2023)で中英二カ国語対応の対話型AI「ChatGLM3」と生成AIアシスタント「智譜清言」を発表しました。これらの製品は、視覚言語モデル「CogVLM」を搭載し、画像や言語の認識能力を向上させることに焦点を当てています。また、「ChatGLM3」はPythonコード生成や実行、データ分析、ファイル処理が可能で、ウェブ検索機能も統合されています。
智譜AIは、一連の大規模言語モデル「GLM-130B」を開発し、これはスタンフォード大学基盤モデル研究センターによって世界の主要大規模言語モデル30選に選ばれました。同社は25億元(約500億円)を調達し、ユニコーン企業となりました。さらに、中国国家インターネット情報弁公室(CAC)からの公式認可を受けており、一般公開が承認されています。
智譜AIのCEOである張鵬氏は、同社が「中国のOpenAI」を目指す意図はないと述べています。彼は、欧米の大規模言語モデルの独占状態を打破し、独自の汎用性言語モデル(GLM)を開発しています。これらのモデルは、コーディング、動画、画像生成が可能で、オープンソース化されており、法人向けの学習、ファインチューニング、デプロイメントなどのサービスを提供しています。
AIアプリの市場での需要が高まりつつある中で、企業がAI技術をより手軽に活用できるようにするため最終的に、智譜AIはMaaS(Model as a Service)プラットフォーム「智譜AIオープンプラットフォーム」を通じて、法人向けに経済的なChatGLMの利用を促進しています。
【アメリカ】 インブーAI (Imbue)|AIモデル
Imbue(インブー)はサンフランシスコを拠点とする人工知能(AI)関連のスタートアップで、最近エヌビディアを含む投資家から2億ドル(約294億円)の資金調達を行い、評価額が10億ドルに達しました。このシリーズBラウンドは、非善意団体アステラ・インスティチュートが主導し、クルーズの共同創業者カイル・ボークトやNotionの共同創業者サイモン・ラストなどが参加しました。
Imbueの共同創業者であるカンジン・チウとジョシュ・アルブレヒトは、人間の意思決定をシミュレートするAIエージェントを開発しています。これらのエージェントは、生物学の研究や褃難なコーディングなど、多岐にわたる用途に役立つことを目指しています。彼らは、AIエージェントが自身で物事を決定し、行動する能力を持っていると説明しています。
このエージェントの開発を進めるために、Imbueは1万台のエヌビディアのH100 GPUを利用し、オープンソースのトレーニング環境「Avalon」をリリースしました。従業員数はわずか20人ほどですが、プロダクトの正式なデモをまだ公開しておらず、異例のスピードでユニコーンの仲間入りを果たしています。
約10年前にOpenAIの共同創業者グレッグ・ブロックマンがサンフランシスコで開いたパーティで、マケーレブと出会ったチウとアルブレヒトは、AI研究者のためのグループハウスThe Archiveを立ち上げました。そして昨年、彼らがAIラボGenerally Intelligent(後にImbueに改称)を立ち上げたとき、マケーレブは主要投資家となりました。
【アメリカ】 タイプフェイス|企業向けAIモデル
Typefaceは、Adobeの元CTOであるアベイ・パラスニスによって設立されたスタートアップで、企業のマーケティングコンテンツ生成を支援するためにジェネレーティブAIテクノロジーを使用しています。このプラットフォームは、OpenAIのGPT-3.5とStable Diffusion 2.0を基にカスタマイズされたモデルを活用し、企業のウェブページやソーシャルメディアの投稿、ブランドロゴなどを学習素材として使用して、ブランドに特化したテキストや画像を生成します。
Typefaceの目的は、企業が専門的なスキルを持つ人材を必要とせずに高品質なコンテンツを迅速に作成できるようにすることです。例えば、Photoshopでプロフェッショナルなコンテンツを作成するのに10年かかる場合がありますが、Typefaceを使用することで、企業はこれらのスキルを持たなくても効率的にコンテンツを生成できます。
また、Typefaceはエンタープライズレベルでの最適化機能を備えており、Microsoft AzureのOpenAIインフラ上に構築されています。これにより、企業はコンテンツのモデレーションやデータのガバナンスを設定し、安全性を確認できます。しかし、Typeface自体はデータや生成コンテンツの安全性の全責任を負わず、企業が独自に安全ルールを設定する必要があります。
シリーズAラウンドでは、GoogleやMicrosoftを含む投資家から6,500万ドルを調達し、AI分野の2大巨頭が参加したことは、Typefaceが独自の価値を提供しているという証拠です。今後も動画やアニメーションなど、さらなるコンテンツ形式の生成を目指しています。
【英国】 シンセシア|動画制作
「Synthesia」は、AIを利用して動画を簡単に制作できるプラットフォームで、2017年にロンドンで設立されました。このプラットフォームは、特に映像制作機器を使用せずに、ソフトウェアだけで迅速に動画を制作することが可能です。利用者はテキストスクリプトを入力するだけで、そのスクリプトに基づいた動画が生成されます。これにより、映像やオーディオの制作にかかる高額なコストと時間を大幅に削減できます。
SynthesiaのビジネスモデルはSaaS(Software as a Service)で、個人向けと法人向けのプランがあります。個人向けプランでは、月額30ドルで毎月10分間の動画を作成することができます。法人向けプランでは、ニーズに応じた利用時間を設定することが可能です。
このサービスは、現在63カ国語に対応しており、ユーザーが入力した言語でアバターが話すことができます。そのため、グローバルな規模でのコンテンツ制作にも適しています。また、企業は内外のコミュニケーション、特に教育、研修資料の制作にSynthesiaを活用しています。
さらに、Synthesiaはビデオ制作や技術的なスキルがないユーザーでも簡単にアクセスできるようにすることを目指しています。これは、ビデオ編集リソースや人員への大幅な投資なしにビデオコンテンツの生産を拡大したい企業にとって特に有益といえます。
最近では、シリーズBラウンドで5,000万ドルを調達し、累計調達額は約76億円
に達しました。この資金調達ラウンドはクライナー・パーキンスが主導し、GV(旧グーグル・ベンチャーズ)やFirstmark Capitalなどが参加しました。SynthesiaのCEOであるVictor Riparbelliは、この技術がエンターテイメント分野にも広がる可能性があるとしており、将来的には「ノートパソコンだけでハリウッド映画を作る」ことを目指しています。
【日本】サカナAI
グーグル出身の著名なAI研究者デビッド・ハ氏とライオン・ジョーンズ氏、元メルカリ執行役員の伊藤錬氏が設立したスタートアップ企業。AIのモデルを一から自作するのではなく、オープンソースの技術を利用することで効率的に最適なモデルを開発しました。次の3種類の日本語対応のAIモデルを効率的に試作しました:日本語で数学の問題を解くモデル、画像に関する質問に日本語で正確に答えるモデル、日本語の指示に基づいて素早く画像を生成するモデル。2024年6月にも約200億円の資金調達をすることが判明。企業価値は約1,700億円を超えるものと見られる。
生成AIの未来展望と挑戦
生成AIと大規模言語モデル(LLM)の技術は、チャットGPTの成功以降、著しい進展を遂げています。今後、生成AIのさらなる進化によって、私たちの生活や働き方にも大きな変化が訪れるでしょう。しかし、技術の進化に伴う課題への対応も重要で、個人情報の保護や道徳的な問題への対策が求められます。
※参考文献
生成AIスタートアップ、23年調達額6割増 430社市場地図
カナダのコーヒア、101言語のAIモデル公開 話者少数も - 日本経済新聞
Cohere、強力でスケーラブルなRAG最適化LLM「Command R+」を発表
Cohere
AIエージェントとの情報共有が鍵、ウオーターフォール開発の新しい在り方
Cognition、世界初の完全自律型AIソフトウェアエンジニア「Devin」を発表
Cognition AI
Mistral AIとは?特徴や主要モデルをわかりやすく徹底解説!
Mistral AI
文章・画像の次は生成AI動画、「Runway」が爆速進化 | 日経クロステック
Runway Research
オープンAIの「限界」を突破するイスラエル企業AI21 Labsの挑戦 | Forbes JAPAN
AI21 Labs
元Appleディレクターが創業した米国のIT企業「Together AI」
Together AI
中国AIユニコーン「MiniMax」、「abab 6.5」リリース | 36Kr Japan
米 Eleven Labs新しい多言語音声モデルを発表。 - マクロモード
ElevenLabs
創業1年で評価額750億円、Google一人勝ちの検索市場で戦うAI企業Perplexity
Perplexity
インド発の生成AIスタートアップのクルトリムがユニコーン入り(インド)
台湾生まれAI先駆者、中国版ChatGPTの普及目指す-独自モデル導入 - Bloomberg
中国AIスタートアップ「創業半年で450億円」調達
注目の大規模言語モデル「Zhipu AI」、新たに対話型AIを発表
智谱 AI开放平台
Imbue raises $200M to build AI systems that can reason and code
エヌビディアなどが2億ドル注ぐAIユニコーン「Imbue」を生んだ2人の起業家
imbue
グーグルとMS出資、ジェネレーティブAIでマーケを変えるTypeface
Typeface
AIでプロ並みの動画を制作する「Synthesia」が累計76億円を調達
Synthesia
Sakana AI Blog