2025年11月24日、当社のエンジニアが所属するAIチーム主導による第1回社内AIワークショップが開催されました。今回のテーマは「If you can't see it, the model can't see it(人間に見えないものは、モデルも見えない)」です。

現場でのAI活用案件が増えていく中、センシンロボティクスのAIチームは、エンジニア・プロジェクトマネージャー・現場メンバーが垣根なく協力しながら、プロジェクトを通じた学びを積極的に共有しています。

社会課題を解決する優れたAIを作ることは、エンジニアだけの仕事ではありません。プロダクトマネージャーやプロジェクトマネージャーなど、現場のデータに最も近い位置にいるメンバー全員が「良いAIをどう育てるか」を理解する必要があります。

本記事では、AIの専門知識がないメンバーも多数参加した、このワークショップのハイライトをご紹介します。質疑応答も活発に行われ、知見を深める機会となりました。

 

1.最新鋭のモデルより、良質なデータ

私たち人間は普段、無意識に文脈や経験を使って欠けている情報を補完しています。例えば、茂みの中に虎の体の一部が見えれば「そこに虎がいる」とわかります。

しかし、AIモデルは「まっさらな状態*1」から始まります。AIにとって、私たちが与えるデータが世界の全てです。AIは「学生のようなもの」であり、はっきり整理された教科書(データ)を与えれば学びますが、曖昧なデータを与えるとテストで落第してしまいます。

つまり、「AIの本当のヒーローはモデルではなく、データなのです」
だからこそ、良いデータセットを作ることが非常に重要です。

*1…ここでは、事前学習済みモデルに対して「案件ごとのタスクに合わせて学習させる部分」をイメージしています。どれだけ高性能な事前学習モデルでも、現場のデータが不足していたり偏っていたりすると、うまく機能しません。

blog-ai-workshop-1

2.ハンズオン:AIの「カンニング」を見破れ!

ワークショップでは、参加者がAIモデルになったつもりでパターンを見つけるハンズオンが行われました。そこで明らかになったのは、AIが陥りやすい「思い込み」や「ズル(ショートカット)」の罠です。

ケーススタディ①:iPhone検出の罠

複数のスマートフォンの写真から「iPhoneを見分ける」という課題で、AI(今回はGeminiを使用) は「Appleのロゴがある=iPhone(正解)」というバイアス(先入観)を持ってしまいました。これは、真の特徴ではなく「たまたま一緒に写っている簡単な特徴」に頼ってしまう ショートカット学習 (spurious correlation) の例です。そしてその結果、問題が判明しました。

・ロゴが見えない角度のiPhoneを見落とす。
・解像度が低い画像では、iPhone 13と14の違い(カメラのわずかな位置ズレなど) を判別できない。

この結果を踏まえて、どのようにデータセットを修正すべきかについて、当社のAIエンジニアによる解説が行われました。

ケーススタディ②:過去のプロジェクトに応用

ある物体の種類を見分けるモデルを作る際、トレーニングデータ画像に「Aには赤いリボン」「Bには白いリボン」が巻かれていたとしたらどうなるでしょうか?

AIは物体の複雑な違いを学ぶのをやめ、「リボンの色」だけを見て分類するようになります。これは人間で言えば、問題を解かずに答えを丸暗記するような「安易な判断基準(ショートカット) 」です。解決策は、リボンのない画像を追加するか、リボンを画像編集で消すことでした。

ケーススタディ③:現場の画像を活用した演習

実際のプロジェクト現場の画像を使った演習(当社のロゴを見つける) では、参加者が物体検知を行うAIとなり、ロゴを見つけました。その結果、全部のロゴを正しく見つけることが難しいことがわかりました。考えられる理由として下記が挙げられました。

1.学習データでは、青色の当社のロゴしかなかった。人間は色違いのロゴを簡単に見つけられるが、学習済みのモデルは青色のロゴしか見たことがないので検知できない可能性がある。
2.強い光や影によってロゴが隠れて見えなかった
3.画像の背景が複雑でロゴを見つけるのが難しい

また、実例としてボルト検知の際に黄色のマークだけを検知したいが、光などの影響で黄色が白色に見えてモデルが「白色である」という間違った特徴を学習してしまうケースも共有しました。

blog-ai-workshop-3

3.「量」と「質」:どれだけのデータが必要か?

「AIを作るには何枚の画像が必要ですか?」というよくある質問に対し、答えは「タスクの難易度による*2」です。

  • 簡単:白い背景の黄色いバナナ(50枚の画像で十分) 
  • 難しい:金属部品上の小さな欠陥(1000枚以上の画像が必要になる可能性あり)

また、データのバランスも重要です。仮に犬の画像が585枚で猫の画像が7枚しかない場合、モデルは「とりあえず全部犬と答えれば98.8%正解できる」と学習してしまい、猫を検出できなくなります。これを「クラス不均衡」と呼びます。

*2…ここで挙げている枚数はあくまで「桁のイメージ」です。実際には、モデルの種類や事前学習の有無、ラベリングの質によって必要枚数は大きく変わります。

4.データ企画:「最悪の事態」に備える

ワークショップの後半では、実際のプロジェクトを想定した「データ企画」を行いました。 重要なのは、データ収集に行く前に「Plan for the worst(最悪の事態を想定して計画する)」ことです。

blog-ai-workshop-4

  • カメラの選定: 
    ドローンで運用するなら、スマホや一眼レフではなく、ドローンのカメラでデータを集めるべきです。画角(アスペクトレシオ)や画質が異なると、AIは推論に失敗する可能性があります。

  • 環境要因:
    撮影する時間帯(昼・夜)や天候、汚れなどがAIにどう影響するかを考慮する必要があります。

  • 生成AIデータの活用: 
    足りないデータを生成AIで作ることも可能ですが、AI画像特有の不自然なノイズ(アーティファクト)が含まれるため、あくまで補助的な利用に留めるべきです。

以上の点を踏まえて、案件開始時にデータ企画書の作成をおすすめします。事前に企画書を作成することにより、管理すべき課題を可視化することができます!




まとめ

今回のワークショップを通じて、AI活用において、以下の点が重要であると再認識しました。

  1. 良質なデータ取得: 
    最新鋭のモデルを使うことよりも、良質なデータを持つことの方が重要です。

  2. データ企画が不可欠: 
    現場に行く前に、必要なデータの量、種類、撮影機材を計画することがプロジェクトの成功を左右します。

  3. 全員がAIの育て親: 
    エンジニアだけでなく、PMもデータ収集の段階からAIの特性を理解して動く必要があります。

センシンロボティクスでは、ドローンやロボティクスを活用した点検業務など「現場の複雑さ」に向き合う機会が多く、AIモデルにも多様な条件が求められます。このワークショップでは、そうした現場のリアルな課題をエンジニア以外も共有できる場となりました。

こうした知見を活かし、現場で本当に「使える」AIソリューションの開発に取り組んでまいります。

センシンロボティクスの取り組みに共感いただけましたら、エンジニアポジションにご応募いただけると幸いです。各ポジションの募集要項はこちらに掲載しています。まずはカジュアル面談からのスタートも大歓迎です。皆様からのエントリーを心からお待ちしています。