自身の25年間の研究を振り返って、発表論文をいくつか選んでみました。なるべく自分が筆頭著者で、かつ査読付きフルペーパー論文を選んでいます。引用回数はGoogle Scholar経由です(2025/4/26時点)。引用回数の多いものを選んだつもりはないのですが、結果的にはそうなっているかもしれません。紹介文は中身を説明したり、しなかったりしています。また専門用語が解説なしに登場します。ご容赦ください。
作成してみた所感としては、インタラクションの研究が好き、ストライクゾーンが狭い、晩年はサバティカルの年しか論文出せてない、という印象です。
上保秀夫
初の査読付き国際会議論文。修士論文をベースにしているが、指導教官がこのレベルまで引き上げてくれたのが実態。当時のNLP研究の様子は分からないですが、言語属性を大規模コーパスから統計的に抽出する手法が流行りだした頃なのかもしれない。また当時CIKMは今ほど通すのが困難な会議ではなかったと思う。当時NTT研究所にいらした東中先生のご著書で割と詳しく紹介していただいたのが自慢。
2. A study of user interaction with a concept-based interactive query expansion support tool (2004) 引用数:79
博士論文のベースの1つとなった論文。初めてのECIR論文。ECIRは今でも好きな国際会議の1つ。SIGIR-APもそうなるといいな。当時、検索UIを作るのは好きだったが、ユーザスタディのユの字も知らず、見よう見まねで実験したのを覚えている。今見ると実験計画は杜撰だし、サンプル数は足りてないし、と反面教師として適切な論文かもしれない。この頃から比べると情報検索分野もユーザ研究の質が飛躍的に向上した。
初めてのSIGIR論文。筆頭著者は指導教官。指導教官の手となり足となりながら研究に関与した論文。テストコレクションの理解を深めたり、データ分析のやり方や、論文の書き方について、ものすごく勉強になったのを覚えている。今考えると、なんと贅沢な時間を過ごさせてもらったのかと。大学図書館の奥深くに入りこみ、古典論文のコピーを入手したのは良い思い出。でも、この論文のおかげでテストコレクション関連の査読依頼がたくさん回ってくるはめに・・・。
グラスゴー大に移って初めての論文かな。現在のCHIIRの前身となるIIiXで発表した論文。オーガニックなSERPの横にワークスペースを設置して、そこで色々やる系の論文。この時はサロゲートに含まれるキーワードを使って検索結果を効率よくフィルタリングする手法に凝っていた模様。一応がんばってユーザ実験も実施した。査読者に「使ってみたい!」と言ってもらえたのが自慢。
今はなきRIAO会議の論文。WordNetの階層水準とコーパスの出現頻度の関係性を調査した論文。WordNetに詳しくなったり、Basic Level of Categoryという概念があることなど、学びの多い研究だった。キャリアを通してあまりやっていないけれど、こういったとことんデータ分析をする研究も嫌いじゃない。
こちらもIIiXで発表した論文。SIGIRに投稿してリジェクトされたけど、こちらでは最優秀論文賞をいただけたので、めでたしめでたしな論文。当時はCollaborative Search(協調検索)が流行っていて、メッセージアプリ系のライブラリを使って検索UIを構築した記憶がある。協調の度合いを3段階に変化させて、その効果を比較検証した。協調検索の研究はしばらく続けていて、その後、会話検索に発展する。
7. Effectiveness of additional representations for the search result presentation on the web (2008) 引用数:44
こちらも検索UI系の論文。2006年発表のECIR論文のジャーナル誌版。Information Processing and Management誌に掲載。SERPのサロゲートの多重表現に着目した研究。当時、検索されたURLのスクショサムネイルをサロゲートに使用する研究があって、そのアイディアを元にビジュアル要素とテキスト要素を増加させた検索UIを作って、その効果を比較検証した。サロゲート設計は重要。
再びECIR論文。個人的にはやや異色な論文で、5番のIIiX論文で実施したユーザ実験のログデータを元にユーザシミュレーションを実施した研究。協調検索では複数人の検索クエリや検索結果が集まるが、それらをどのように活用すればよいのか分かっていなかったので、クエリ拡張やクラスタリングなどを適用し最適な組み合わせを見つけようとした論文。ユーザ実験のデータを活用できたという意味では、よい論文。
9. A survey of patent users: an analysis of tasks, behavior, search functionality and system requirements (2010) 引用数:89
こちらもやや異色な論文。当時、欧州で莫大な予算が特許情報検索に降ってきて、その時に実施した調査系論文。IPの分析アナリストを対象に、情報検索行動について調査し、システム要件を洗い出した研究。普段は交流のない、企業で知的財産を扱う方々とお近づきになれたのは非常に新鮮だったし、確率的ランキングが裁判では役に立たないなど、学び多き体験だった。
10. Looking at the viewer: analysing facial activity to detect personal highlights of multimedia contents (2011) 引用数:144
動画クリップ視聴中の表情を録画して表情分析器にかけ、表情カテゴリの分布から、個人的ハイライトを検出することを試みた研究。2009年に発表した国際会議論文のジャーナル誌版。Multimedia Tools and Applications誌に掲載。個人的には、はじめて動画を扱った研究かもしれない。当時アムステルダム大にいた共同研究者が開発した表情分析器に感動して、本論文の研究アイディアが生まれたのを覚えている。
再び検索UI系の論文。Exploratory Searchを構造化させるためにクエリ文法と検索UIを設計・実装して、その効果をユーザ実験で検証した論文。当時MSRAにいらした酒井先生に温かく見守っていただいた研究。さらに、日本に戻ってきて知り合いのいない時期に、NTCIR VisExの皆様の仲間に入れてもらえて実現した研究。引用数0だなんて信じられない。こういう研究が今でも好き。
検索トピックを過去情報重視、最新情報重視、未来情報重視の3属性に分けて、それぞれの情報検索行動をユーザ実験を通して比較検証した研究。使用するキーワードやアクセスする情報源の種別に特徴があることを解明した。Information Processing and Management誌の特別号に採録。キャリアを通してお世話になるNTCIRで構築したテストコレクションをユーザ研究に活用できた良い例。
ペアによる旅行計画タスク中の情報探索会話データの収集実験からアノテーション、そして情報ニーズ発話抽出に有効な素性の同定までを報告したSIGIR論文。筆頭著者の志賀くんが頑張ってくれた研究。査読はやや割れた模様で、おそらくメタレビュアーに救われた論文。2016年度サバティカルの成果の1つ。後の会話式情報検索(Conversational Search)につながった。そう言えば、この年はSIGIRのGeneral Co-chairも担当したんだった。
ボーナストラック. An Instruction-Response Perspective on Large Language Models in Information Retrieval Tasks (2025) 引用数:不明
最新のSIGIR論文。生成AIモデルを検索エージェントとして利用する際の、実験方法論とケーススタディを提示したパースペクティブ論文。2024年度サバティカルの成果の1つ。研究室の今後の方向性を示唆した方法論的論文なので、出版できてほっとしている。久しぶりの筆頭著者論文。