GMGM 🫡 建設は止まらず、こちらがSkillful AIで起こっている最新のアップデートです。
@Googleとの統合からAI搭載の音声、Discordエージェント、Telegramのメディア処理まで👇
プラットフォームのアップグレード 🛠
- Googleスキルは最終テスト段階にあります。まもなくエージェントをGoogleカレンダー、Docs、Sheets、Drive、Gmail、Keepに接続できるようになり、すべて安全なOAuth 2.0統合で行われます。
- すべてのスキルは現在、エラー検出と報告のための標準化されたシステムを使用しており、エージェントの挙動がより予測可能になり、デバッグが格段に速くなりました。
- Geminiモデルは安定しています。非同期通信の最近の問題は解決され、モデルは現在エージェント間で信頼性高く稼働しています。
Image Hubの進化 🎨
- Image Hubのコアを再構築し、より高速で信頼性が高く、拡張しやすくなりました。
- 画像生成、検索、タグ付け、履歴追跡は新しいサーバーレスインフラ上で稼働しており、これによりパフォーマンスが向上し、よりスムーズな体験を提供します。
- 画像コレクションのサポートも準備中で、AI生成コンテンツをより効果的に整理・管理できるようになります。
- 裏側ではコードベースを簡素化し、新機能のリリースをより速く、バグを減らし、長期的な安定性を向上させています。
音声、メディア&AIコミュニケーション 🎤
- ElevenLabsを統合し、SkillfulにText-to-Speech機能を導入しました。バックエンドは稼働中で、エージェントがアプリ内で直接話せる簡単な方法を構築中です。
- Telegramはメディア対応に。Telegram経由でエージェントに音声を送信でき、自動的に文字起こしと処理が行われます。
- ライブ応答がよりクリーンに。ストリーミング出力のMarkdownフォーマットが修正され、回答がリアルタイムで正しく表示されるようになり、スタイルの崩れや不自然な間隔はなくなりました。
エージェント&機能の強化 📦
- 改良されたデータセットとスマートなプロンプトでプランニング戦略を洗練し、エージェントが複数ステップのタスクをより正確に考え、よりクリーンな出力を実現します。
- 自動化ルーチンが登場予定。エージェントが繰り返しタスクをエンドツーエンドで実行できるオーケストレーションシステムを構築中です。
- 音声やメディア処理などの新機能は統一されたAgentRequestシステムの下で標準化され、より速く一貫したエージェントのアップグレードが可能になります。
🧠 統合&コミュニティ
- Discordサポートが間もなく登場。WebSockets経由で接続するリアルタイムDiscordエージェントを開発中で、SkillfulのエージェントがTelegramと同様にDiscordサーバー内で直接ライブ応答できるようになります。
- 専用フォーラムを設置し、新しいプロンプトを共有して、エージェントをより活用できるよう支援しています🤝(Discordに参加してぜひご覧ください)。