• 発売日:2025/03/10
  • 出版社:共立出版
  • ISBN:9784320125551

読み込み中…

コンピュータビジョン最前線 Spring 2025

コンピュータビジョン最前線 Spring 2025

井尻 善久 (編集)
牛久 祥孝 (編集)
片岡 裕雄 (編集)
藤吉 弘亘 (編集)
延原 章平 (編集)
通常価格 3,300 円(税込)
通常価格 セール価格 3,300 円(税込)
SALE 売り切れ
  • 発売日:2025/03/10
  • 出版社:共立出版
  • ISBN:9784320125551
ネットストア在庫 詳細
    読み込み中...
My店舗在庫
    My店舗登録で在庫確認と店舗お受け取りのご利用が可能になります。(要ログイン)
  • 在庫表示のサンプル
商品説明
【最新動向サーベイ】「イマドキノロボット基盤モデル」大規模言語モデルや視覚言語モデルなどの基盤モデルの発展に伴って、ロボティクスにおいても認識や制御の部分で基盤モデルを活用する事例、また、ロボティクス領域での基盤モデルを構築しようとする事例が見られるようになってきた。本稿では、ロボティクス領域での基盤モデル、すなわち、ロボット基盤モデルを構築することを目的とした研究事例を中心に紹介する。/「イマドキノCV for Earth」環境問題の解決に向けて、画像認識技術がどのように利用されているのか、生物多様性と動物保護、森林保護、廃棄物・汚染管理、持続可能な農業と食糧生産の4つの分野に焦点を当てて紹介。それぞれの分野において研究者たちがどのように課題と向き合い、データをとり、手法を適用していったのかを解説する。/「イマドキノ音声合成」ニューラルネットワークを用いた大規模言語モデルの進展に伴い、音声の離散表現に基づくテキスト音声合成(TTS)手法が数多く提案されている。これらの手法は、単に高品質なTTS を実現するだけでなく、数秒から数分の限られた音声から、モデルの再学習を必要とせずにその声質や話し方を忠実に再現するゼロショットTTS を可能にしている。本稿では、これまでのTTS 手法の変遷について紹介し、近年提案されている言語モデルに基づくTTS の研究動向の解説をする。/「イマドキノマルチエージェント経路計画」グラフ上の複数エージェントに対し、互いに衝突のない経路を計算する問題はマルチエージェント経路計画(MAPF)と呼ばれ、多数の魅力的な応用がある。人工知能・ロボティクス分野で大きな注目を集めているMAPF 研究について、その経緯と最新の動向を紹介する。

【チュートリアル】「ニュウモン実世界情報と基盤モデル」Vision and Language 技術の進展により、画像認識とテキスト理解の双方が求められる画期的な手法やデータセットが開発され、これまでの画像とテキストの理解を超えて、画像、3D、そしてロボティクスを言語モダリティと結合する機運が高まっている。本稿では、大規模言語モデルや視覚言語モデルについて、その性質や課題を参照表現理解などの視点から解説し、3D 理解や実世界理解、ロボット基盤モデルなどのより複雑なモダリティの理解およびインタラクションの研究へのアプローチについて議論する。

そのほか、国内外から注目を集めているSakana AIのインタビュー記事や、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」、漫画「電脳探偵メタデンコ」を掲載。
目次
巻頭言(片岡裕雄)

イマドキノロボット基盤モデル ―ロボティクスでの基盤モデルの構築―(松嶋達也)
イマドキノCV for Earth ―CV で地球問題を解決する!―(篠田理沙)
イマドキノ音声合成 ―大規模言語モデル時代のTTS に迫れ!―(山本龍一)
イマドキノマルチエージェント経路計画 ―大規模オートメーションへの挑戦!―(奥村圭祐)
ニュウモン実世界情報と基盤モデル ―実世界情報から推論する最先端―(栗田修平)
Sakana AI 突撃インタビュー(秋葉拓哉・井ノ上雄一・黒木颯(聞き手=綱島 秀樹))

電脳探偵メタデンコ(こそうねすみ@kosonesumi)

CVイベントカレンダー
詳細を表示する

カスタマーレビュー

honto本の通販ストアのレビュー(0件)

並び順:
1/1ページ

最近チェックした商品