見出し画像

社会に貢献できる技術を生み出すための学びと挑戦

それぞれの働く現場でいきいきと活躍する社員を紹介する「Meet the CONNECTer」。今回ご登場いただくのは、先進技術研究所マルチエージェントシステム研究部で画像センシングによる行動認識の研究開発を行う里 雄二さんです。社内のメンバーと参加した世界トップレベルの学会のコンペで準優勝を果たすなど、技術者として確かな腕をもつ里さんに、コンペにかける思いや研究開発に向き合う姿勢、現在チャレンジをしていることについてなどをお伺いしました。


里 雄二
2002年新卒入社、現在は技術研究開発本部 先進技術研究所 マルチエージェントシステム研究部所属。22年のキャリアの中で人物動作認識技術を中心に研究。



画像センシングの技術者に訪れた転機

編集部:里さんは2002年の新卒入社以降、どのようなキャリアを積んでこられましたか?

里:入社当初は先端技術研究所内にあるモバイルネットワーク研究所の配属となり、アプリケーションの著作権保護技術の開発に携わっていました。その後、さまざまな部署を渡り歩き、2010年から現在にいたるまで、画像解析による人の行動認識の研究開発を行っています。

実は私、大学では画像技術を専門に学んでいたのですね。ただ当時、盛り上がりをみせていたモバイル分野の開発にも関心があったため、入社時は面談で出した希望が通ったかたちとなりました。そのような背景もあって2010年に画像センシング技術の開発チームへアサインされたのですが、自分の根底にある知識を改めて活かせるなと、前向きな気持ちでの部署異動だったと記憶しています。この部署では外部の方と推進するプロジェクトも多々ありまして、なかでも2011年にスタートした慶應義塾大学との共同研究は自分のターニングポイントとなりました。

編集部:慶應義塾大学との関わり方や共同研究を通じて得た学びなど、ぜひお聞かせください。

里:企業や大学との共同研究では、基本的に月1回程度のペースで打ち合わせを設定し、進捗共有を行なっていきます。しかし慶應義塾大学との共同研究では、大学内にプロジェクト専用の研究ルームを設置。学生さんとともに私もそこに常駐し、研究を進めていきました。

担当してくれた学生さんがとても頑張ってくれ、2011年度の「第17回 ビジョン技術の実利⽤ワークショップ」では「姿勢変動に伴う身体特徴変化の統計的モデリングによる遮蔽に頑健な人物追跡」の研究が優秀論文として「画像応用技術専門委員会 小田原賞」を、2017年度には「畳み込みニューラルネットワークによる距離学習を用いた動画像人物再同定」の研究で「精密工学会 沼田記念論文賞」を受賞したのです。研究開発はオープンに発信していくことが大事ですし、そこで得られたさまざまなフィードバックが研究をより良いものにしていくのだと実感できました。

準優勝を果たした世界的学会のコンペに参加した理由

編集部:里さんは社内のメンバーとチームで参加した世界最高峰の画像認識国際学会「CVPR(Conference on Computer Vision and Pattern Recognition)2021」の第3回「EPIC-KITCHENS-100 2021 Challenges」コンテストの動作予測(Action Anticipation)部門で準優勝、さらに2023年に開催された同学会の「3rd International Ego4D Workshop」における「Ego4D Challenge 2023」の長期動作予測部門で準優勝を獲得されています。素晴らしいご実績ですね。
 
里:私たちが参加したのは、いわゆる「行動予測」の部門です。人の行動に関する技術は世界的に需要が拡大しており、パナソニック コネクトとしても行動予測に関連するサービスやソリューションを提供する機会は増えていました。だからこそアカデミックな領域でも実績を残したいという思いがあり、コンペへの参加を決意したのです。
 
「EPIC-KITCHENS-100 2021 Challenges」はキッチンの動画が与えられ、1秒後に起こるであろう動作の動詞・名詞を予測し、その精度を競うというもの。具体的には「このキッチンで1秒後に何が起こるか?」という問いに対し、「食器を洗う」、「野菜を切る」、「冷蔵庫を開ける」など、1つの動作を弾き出していきます。「Ego4D Challenge 2023」は長期動作予測となる、より難しいタスクとなりました。「机の上でナッツの皮を剥く」、「屋外で木材を削る」といった、20個の連続した動作を予測する必要がありましたので。
 
どちらのコンペも2位という結果は、嬉しさと同時に悔しさも感じています。ですが自分たちの技術が世界レベルに達していると客観的な指標として確認できましたし、メンバーのモチベーションも上がりました。コンペに参加した意義は十分に感じています。
 
編集部:里さんたちが研究開発を進めている行動予測技術は、すでに現場で適応されているのでしょうか?
 
里:予測タスク、とくに長期の動作予測はかなり難しく、残念ながら現状では現場課題を解決出来る精度にまでいたっておりません。しかし製造・物流現場での業務プロセスの改善に対し、現場で実施されるあらゆる作業を可視化、分析するための技術として活用できることが想定されます。行動予測技術が実用化されれば、製品組立工程での不良改善やピッキング作業の効率化に加え、店舗設計への応用、介護現場での転倒防止、駅ホームの落下防止など、多様な業界での導入が期待できるでしょう。

社会で役立つ技術を開発すべく、貪欲に学び続ける


 
編集部:お仕事に取り組むうえで、常に意識していることはありますか?
 
里:自分たちの技術は何を解決しようとして、そのために何をするべきか、なぜその方法でよいのかを、常に考えて答えを出すように心がけています。私が最初に配属された先端技術研究所では10年後の世界をイメージして技術開発に取り組んでおり、現在よりも長いスパンで技術を進化させていくことができました。しかし今は企業や社会が抱える課題に付随する技術をシビアに求められるため、現在と未来を見据え、技術の役割や価値を根本から意識しています。
 
編集部:現在、チャレンジしていることとは?
 
里:同じ課のメンバーと一緒に、トップランクの国際学会への論文投稿に挑戦しています。論文の投稿はコンペと同様、自分たちの技術レベルの客観的な評価を確認する意味もある。仕事では現場に適応できる行動解析技術を開発し、論文ではさらにその先にある課題を見越した開発に取り組んでいます。
 
また、NLP(自然言語処理)についても勉強しているところです。画像領域で使われているアイデアはNLPの世界の応用であるケースが多いため、技術者としてはやはりその辺りの知識も習得しておきたいので。何より私にとって新しい技術を得ることは、純粋に面白いのです。これからの時代、画像センシングを専門とするといえど、NLP、音声認識、MLOpsといった多様な技術も有すエンジニアが必要とされるはず。自分の専門性を高めるためにも、技術の補強をし続けていきたいと考えています。

幸せな技術者人生を歩むために


 
編集部:同期の方との交流は、現在も続いていますか?
 
:はい。海外勤務者もいれば、現場に近い人もいます。先日、久しぶりに同期10人くらいで集まったのですが、みんなが重ねてきた経験や他愛のない話をしながら、とてもリラックスした時間を過ごすことができました。同期が活躍している姿を見たり聞いたりすると、私もすごく嬉しいですし、励みになります。行動解析技術に関する相談や情報交換も気軽に行えるのは、同期という関係性ならではですよね。彼らは本当に大切な存在ですし、このつながりをずっと大事にしていきたいと思っています。
 
編集部:素敵なご関係を築かれているのですね。最後に、里さんが目指す技術者のあり方についてお聞かせください。
 
:私はいたって標準的なタイプの人間です。だからこそ学びを止めない技術者でありたい。満遍なく幅広い知識を吸収し、その知識を磨き上げ、自分の土台としていきたいのです。幸運なことに長年画像センシングの分野に携わらせていただき、自身の柱をつくることができました。もともと黙々と研究開発を行うことが好きな気質ですしね。どんなときもチャレンジをしている状態をつくり、現場で役立つ技術を生み出し続けられたら、楽しい技術者人生が送れるのだろうなと考えています。
 

この記事が参加している募集