笑い、悲しみ、喜ぶ、表情豊かなしゃべるAIアバター生成ツール「Synthesia」/ChatGPTが記憶する能力「Memory機能」実装【今週公開の最新AIツール&ニュース】

AI大学【AI&ChatGPT最新情報】
28 Apr 202422:43

TLDR最新のAIツールとニュースを紹介する動画の要約です。話題のAIツールとして、感情豊かな表情で話すアバターを生成できる「Synthesia」の「Expressive1」機能や、会話内容を記憶しユーザー好みに近い会話を生成する「ChatGPT」の「Memory機能」が挙げられます。また、高品質な画像生成AI「Adobe Firefly」3のベータ版が発表されました。さらに、AI関連のニュースとして、Microsoftとコカ・コーラの戦略的パートナーシップ、日経が経済特化のLLMを開発したと発表したことも触れられています。これらのAIツールやニュースは、今後のAI技術の発展を予感させる内容となっています。

Takeaways

  • 🎉 Synthesiaのエクスプレス1機能が実装され、感情豊かなAIアバター動画を生成できるようになりました。
  • 📚 ChatGPTが新たに「Memory機能」を実装し、ユーザーとの会話内容を記憶して好みに合わせた回答を提供します。
  • 🖼 Adobe Photoshopの最新版であるAdobe Fresco 3 Foundationがリリースされ、より高品質な画像生成が可能になりました。
  • 👗 IDMBYONは衣服の画像を別の衣服に変更可能な仮想試着AIモデルとして公開され、自然な画像生成が可能です。
  • 📱 LEON technologies JAPANはGPT4などを実装したAIチャットをモバイルアプリで提供し、2024年上半期に公開される予定です。
  • 🔢 Microsoftが小規模言語モデル53を発表し、モバイル環境でも動作し、商用利用が可能になりました。
  • 👓 Metaはスマートグラス「レヴァメタ」に目の前のオブジェクトを分析するAIアシスタントを実装し、ハンズフリーでの情報を得られる機能を提供します。
  • ✅ Googleの親会社アルファベットはAI技術の開発に資金を投じ、クラウドサービスの成長に貢献しました。
  • 📈 MicrosoftのAI効果で決算が好調で、クラウドサービスとビジネスソフトウェア製品へのAI導入が業績を押し上げました。
  • 🌐 OpenAIはNVIDIAのAIスーパーコンピュータDGX H200を納入し、生成AIとLLMを高速に動作させることができるようになりました。
  • 💰 AI企業Paplelexityは資金調達を行い、ユーザーの増加と業績拡大を支援するために使用される予定です。

Q & A

  • 「Synthesia」はどのようなAIツールですか?

    -「Synthesia」は感情豊かな喋るAIアバター動画生成ツールで、160種類以上のAIアバターと130以上の言語に対応しています。テキストを入力するとアバターがそれを喋り、表情豊かに表現することができます。

  • 「ChatGPT」の新機能「Memory機能」とは何ですか?

    -「Memory機能」は、ユーザーが会話した内容をチャットGPTが記憶し、ユーザーの好みを把握して好みに近い会話を生成する機能です。これにより、よりパーソナライズされた対話が可能になります。

  • Adobeの画像生成AIモデル「Adobe Firefly」の最新版「Foundation」はどのような特徴がありますか?

    -「Adobe Firefly Foundation」は、全バージョンよりも性能を大幅に改良し、高品質な画像が作れるようになりました。プロンプトとの理解度が向上し、より詳細に多くのバリエーションの画像を生成できるようになっています。

  • 「idm byon」とはどのようなAIモデルですか?

    -「idm byon」は、人物画像の衣服を別の衣服に変更可能な仮想試着AIモデルです。より自然な画像を生成し、衣服の詳細を保持しながら現実に即した仮想着画像を生成することが可能です。

  • 「LEON」のモバイルアプリはどのようなAIサービスを提供しますか?

    -「LEON」のモバイルアプリは、GPT4などを実装したAIチャットを提供し、無料で利用できるAIサービスです。モバイルアプリ版のリリースに伴い、事前登録者にはCL3を無料無制限で提供する予定です。

  • Microsoftの「53」とはどのようなAIモデルですか?

    -「53」は、Microsoftが発表した小規模言語モデルで、3つのモデルが用意されています。その中でも最小のモデル「53mini」はオープンモデルとして商用利用も可能で、言語、コーディング、数学の様々なLLMベンチマークで高い性能を発揮します。

  • 「Meta AI with Vision」とはどのような機能ですか?

    -「Meta AI with Vision」は、目の前のオブジェクトを分析して情報を提供するAIアシスタントです。例えば、外国語のメニューを翻訳したり、建物についての質問に答えるなど、ハンズフリーで情報を得ることができます。

  • 「Sensus Time」の「Sensus Nova 5.0」はどのようなAIモデルですか?

    -「Sensus Nova 5.0」は、中国のAI企業Sensus Timeが開発した大規模言語モデルで、10TB以上のデータで訓練され、200Kのコンテキストウィンドウを持つことで、様々なLLMベンチマークで優れた性能を示しています。

  • Microsoftとコカ・コーラが発表した戦略的パートナーシップの内容は何ですか?

    -Microsoftとコカ・コーラは5年間の戦略的パートナーシップを発表し、コカ・コーラはMicrosoftクラウドとその生成AIの機能に11億ドルを投資します。双方はビジネス分野での革新的な生成AIの使用事例を共同で実験しているとされています。

  • 日経が開発した経済特化のLLMはどのようなものか?

    -日経が開発した経済特化のLLMは「日経ランゲージモデル」と名付けられ、約40年分の日経グループの新聞や雑誌の記事を学習させて作られています。記事の要約機能などでの活用が見込まれています。

  • Googleの親会社アルファベットの決算はどのような結果を出したのですか?

    -Googleの親会社アルファベットは、2024年1月から3月期の決算で売上高がアナリスト予想を上回り、クラウドコンピューティング部門の成長が業績を牽引しました。AIの開発に資金を投じた戦略がクラウドサービスの需要促進に貢献したとされています。

Outlines

00:00

😀 Introduction to AI Tools and News

The video introduces various AI tools and recent updates in the field of AI. It discusses Synthesia's Express1 feature for creating emotionally rich avatars, ChatGPT's new memory function, Adobe's image generation AI model, Adobe Firefly 3, and Foundation. The video also covers strategic partnerships, such as Microsoft and Coca-Cola's collaboration, and the development of an economic-focused large language model by Nikkei. The introduction ends with a brief mention of Microsoft and Coca-Cola's strategic partnership announcement and the development of an economic specialized LLM by Nikkei.

05:00

📈 Updates on Adobe Firefly 3 and Other AI Tools

Adobe Firefly 3 Foundation, the latest version of Adobe's image generation AI model, is highlighted for its improved performance and ability to create high-quality images with better understanding of prompts. The video also introduces idmbyon, a virtual fitting AI model that can change clothing on a person's image to another, and LEON, a mobile app by LEON technologies JAPAN that implements AI chat using GPT4. Additionally, Microsoft's small-scale language model 53 is mentioned, with its smallest model, 53mini, being open for commercial use.

10:02

🤖 AI Assistants and Language Models

The video discusses Meta's AI assistant with vision, which can analyze objects in front of the user, such as translating foreign menus or providing details about buildings. It also covers the implementation of a feature in Anthropic's AI chat that allows users to stop responses mid-output. Furthermore, Apple's open-source language model, OELM, is introduced for its efficiency and capability to run on mobile environments. Lastly, SenseNova 5.0, a large-scale language model developed by a Chinese AI company, is mentioned for its extensive training and performance in various benchmarks.

15:04

📱 AI in Business and Technology News

The video summarizes recent AI-related news, including Microsoft and Coca-Cola's strategic partnership, with Coca-Cola investing in Microsoft's cloud and AI capabilities. It also covers the development of an economic-focused large language model by Nikkei, Microsoft's positive financial results due to AI integration in their cloud services and business software products, and Alphabet's (Google's parent company) good financial performance partly due to their investment in AI development. Additionally, the video mentions NVIDIA's delivery of AI supercomputers to OpenAI and Apple's acquisition of a French AI startup, Data.karabo.

20:06

💼 Funding and Corporate AI Developments

The video concludes with updates on funding and corporate developments in AI. It mentions that AI company Perceptia has secured funding, with investors like NVIDIA, to expand its user base and business performance. Partnerships with SoftBank and Deutsche Telekom are also highlighted. Additionally, Apple's potential AI product announcements at an upcoming developer event are anticipated, following their acquisition of the French AI startup.

Mindmap

Keywords

💡Synthesia

Synthesiaは、感情豊かな喋るAIアバター動画生成ツールです。160種類以上のAIアバターと130以上の言語に対応し、テキストを入力することでアバターが喋ってくれる機能があります。新機能のExpress1により、入力されたテキストの感情に合わせてアバターの表情が変わることが可能です。この機能は、より自然で感情豊かなコミュニケーションを可能にしています。

💡ChatGPT

ChatGPTは、会話内容を記憶し、ユーザーの好みに合わせた回答を生成するAIチャットボットです。新機能のメモリー機能により、以前の会話内容を記憶し、その情報を基にパーソナライズされた回答を提供することができます。これにより、ユーザーとの対話がより個性化され、好みに合わせたサービスが期待できます。

💡Adobe Firefly

Adobe Fireflyは、画像生成AIモデルの最新版で、より高品質な画像を生成できるようになりました。プロンプトとの理解度が向上し、詳細に多くのバリエーションの画像を作成することが可能になりました。また、Photoshopのベータ版にも実装され、テキストから画像を生成する機能や、既存の画像を拡張・変更する機能が追加されました。

💡idm byon

idm byonは、人物画像の衣服を別の衣服に変更可能な仮想試着AIモデルです。自然な画像を生成し、衣服の詳細を保持しながら現実に即した仮想試着画像を作成することが可能です。これにより、オンラインショッピングやファッション業界において、仮想試着体験が向上し、新しいビジネスチャンスをもたらす可能性があります。

💡LEON

LEONは、GPT4などを実装したAIチャットを提供する無料AIサービスです。2024年上半期にモバイルアプリを公開する予定であり、事前登録者にはCL3を無料で提供しています。モバイルアプリのリリースにより、より多くのユーザーがAIチャットの利便性を体験できるようになります。

💡53

53は、Microsoftが発表した小規模言語モデルで、モバイル環境でも動作するように設計されています。53miniはオープンモデルとして商用利用も可能で、AIプラットフォームのHugging Faceで利用できます。このモデルは、言語モデルの中では軽量ながらも高い性能を発揮し、様々なAIチャットで活用されています。

💡Meta AI with Vision

Meta AI with Visionは、レバレメタに実装されたAIアシスタントで、目の前のオブジェクトを分析して情報を提供します。外国語のメニューを翻訳したり、建物の詳細を教えてくれるなど、ハンズフリーで情報を得ることが可能です。この機能は、既にアメリカとカナダでベータ版として導入されており、新たな利便性を提供する可能性があります。

💡OELM

OELMは、Appleの研究者らが公開したオープンソースの言語モデルで、パラメータ数が少ない代わりに実行コストが低く、モバイル環境でも動作することが可能です。OELMはトランスフォーマーモデルを使い、各階層内でパラメーターを効率的に割り当てることにより、性能を向上させています。

💡センスノバ5.0

センスノバ5.0は、中国のAI企業センスタイムが発表した大規模言語モデルで、10TB以上のデータで訓練され、200Kのコンテキストウィンドウを持ちます。中国のニュースメディアの記事を学習させて作られ、様々なAI技術のベンチマークで優れた性能を示しています。

💡Microsoft クラウド

Microsoft クラウドは、Microsoftが提供するクラウドサービスで、Microsoft Azureが中心的なプラットフォームです。コカコーラがMicrosoftクラウドとその生成AIの機能に11億ドルを投資し、ビジネス分野での革新的な生成AIの使用事例を共同で実験しています。これにより、AIの活用がより一層加速しそうです。

💡NVIDIA DGX H200

NVIDIA DGX H200は、NVIDIAが2023年11月に発表したハイクラスGPUシステムで、現在主流のH100よりも大幅にパフォーマンスが向上しています。OpenAIの社長がこのAIスーパーコンピュータを受け取り、生成AIやLLMをこれまで以上に高速に動作させることが期待されています。

Highlights

AIツールシンセシアに感情豊かなアバター動画生成機能「エクスプレス1」が実装されました。

シンセシアは160種類以上のAIアバターと130以上の言語に対応しています。

エクスプレス1機能で、テキストの感情を読み取り、表情豊かなアバターを生成できます。

チャットGPTの新機能「メモリー」が実装され、会話内容を記憶してユーザーの好みに近い会話を生成します。

adobファアフライイージ3ファウンデーションがリリースされ、高品質な画像生成が可能になりました。

idm byonは衣服を仮想的に交換可能なAIモデルで、自然な画像生成が可能です。

LEON technologiesJAPANはGPT4を実装したAIチャットのモバイルアプリを公開予定です。

Microsoftの小型言語モデル53が発表され、モバイル環境でも動作するようになりました。

メタAIwithビジョンが実装され、目の前のオブジェクトを分析して情報を提供する機能が追加されました。

クロードのAIチャットで回答を途中で強制停止できる機能が実装されました。

Appleの研究者らがオープンソースの言語モデルOELMの論文を公開しました。

センスノバ5.0が発表され、10TB以上のデータで訓練された大規模言語モデルです。

Microsoftとコカ・コーラが戦略的パートナーシップを発表し、AI技術を共同で活用します。

日経が経済特化の大規模言語モデルを開発し、記事の要約機能などで活用を見込んでいると発表しました。

MicrosoftのAI導入が業績を押し上げ、2024年1月から3月期決算が好調です。

Googleの親会社アルファベットもAI効果で決算が好調で、クラウドコンピューティング部門の成長が業績を牽引しました。

OpenAIにNVIDIA dgx H200が納入され、生成AIとLLMを高速に動かすためのAIスーパーコンピュータです。

AI企業のパプレシティアが資金調達を行い、ユーザーを増やし、業績の拡大を支援する予定です。

AppleがフランスのAIスタートアップDATAKLABOを買収し、AI技術の導入を進める戦略の一環です。