はてだBlog(仮称)

私的なブログど真ん中のつもりでしたが、気づけばWebサイト系のアプリケーション開発周りで感じたこと寄りの自分メモなどをつれづれ述べています。2020年6月現在、Elasticsearch、pandas、CMSなどに関する話題が多めです。...ですが、だんだんとより私的なプログラムのスニペット置き場になりつつあります。ブログで述べている内容は所属組織で販売している製品などに関するものではなく、また所属する組織の見解を代表するものではありません。

顧客の本当に"探して"いたもの(検索UXとチューニング考察)

ソフトウェア開発の方面では、顧客の本当に欲しかったものという有名な風刺絵(?)があります。

https://www.google.com/search?q=顧客が本当に欲しかったもの

私はこのイラストで表現された「あるある」が非常に好きなのですが、最近、もう少し狭い範囲ですが、似たようなことを感じることがありました。

そこで、顧客の本当に欲しかったものになぞらえて、検索サイトでのサーチのUXと良く耳にする技術等の関係をややシニカルに評した「あるある」のようなものをまとめてみました。 *1

顧客の本当に欲しかったもののストーリーと同様、(なぜそうなったか・なりがちかはともかく)うまくいかない例をまとめています。

サーチのUXという意味では、古くより再現率と適合率のトレードオフが根底にありますが、個々の技術をとって見ても正答が一つではない類の話なので、常にトレードオフがつきまとい、チューニングの努力の割に、思ったほど効果が出ないとか悪い方によってしまう...という構造が顧客の本当に欲しかったもののストーリーの流れと似たとこもあるのではというのが自分の感覚です。

見てのとおり、アルゴリズムとソリューションと手法とそれ以外が同じ並びに混在しています。また、ある手法はあるソリューションの一部であるようなものも厳密に分類していません。 もともと大喜利的なところなので、ご容赦くださいませ。

また、この技術や手法はこれが弱点だというところを勘違いしている可能性もありますので、こう書いた方が良いというのがあればアドバイスいただければ幸いです。*2

顧客の本当に探していたもの

f:id:azotar:20181129152343p:plain

以下は、上記絵のネタの雰囲気レベルの解説です。

  1. 形態素解析さん: 真摯に対応してくれているヒトという印象でした。こちらとしては他のスタッフにも協力してもらったら良いのにと思ったり、すぐ後ろの棚に置いてあるアレが欲しんだけどなぁとは思いましたが。*3
  2. N-Gramさん: このヒトは、何かの取漏れでこっぴどく怒られた過去の経験がトラウマになっているのかもしれません。
  3. 外付けシソーラスさん: 昔の別の職場でエラい人に「俺が痛いといったら病院だろ」と言われた経験が生きているのでしょう。
  4. あいまい検索さん: ハイコンテキストな職場の経験から行間を読むことに慣れすぎてしまったのかもしれません。また、他のヒトよりも回答を返すまでに時間がかかってかなり待たされました。
  5. フレーズ検索さん: この検索ワード例とほぼ同じような言い回しはデータに存在しないようです。今思えば、このヒトに聞くまでもありませんでした。
  6. テキストマイニング...: 致し方ないのですが、適合度を算出するアルゴリズムの裏を書くようなデータがたまたま存在したようです。
  7. 自然語検索さん: 検索したいものを深読みしてしまったのか、はたまた、お・も・て・な・しの心なのか。いずれにせよ、この人の力を借りるにはまだ少しタイミングが早かったかもしれません。
  8. マーケティングオートメーションさん: 気が利いているのか、空気を読もうとして逆にお仕着せがましくなっているのかもしれません。
  9. ユーザートラッキングさん:
  10. 双子のA/Bテストさん: この人達に会うと、時々ウォーリーを探せや間違い探しゲームをさせられている気分になります。
  11. 協調フィルタリングさん達:最初に問い合わせる相手ではなかったようです。
  12. 教師あり機械学習さん: 悪い先生に教えを請うたか、勉強熱心のガリ勉が裏目に出たようです。
  13. 教師なし機械学習さん:確かにこの人はある方面のエキスパートだなと感じました。ただ、まれにいる「僕はヒントを与えるけど決めるのは君だよ」という回答をしてくるヒトだったようです。聞く相手を間違えたかもしれません。
  14. インスタグラマーさん:今回はいやな気持ちにはなりませんでしたが、このタイプのヒトのノリにはついていけないことがあります。

この記事は、次の記事と連動するつもりでしたが、演出力の欠乏から、そこまでうまく話がつながりませんでした。機会があれば今後これらを繋げる記事をまとめてみたいと思います。

itdepends.hateblo.jp

*1:タグにElasticsearchと入っていますが、単にこの記事のネタを考えている時に、Elasticsearchに触れている時期だった&補足や解説をするにあたって、アカデミックな用語や概念定義するよりも、ElasticsearchのコレコレのAPIだと...という話に繋げれればというところの意図で、この図に挙げたものがElasticsearchや各種検索エンジン等の弱点というわけではありません。 分かる方には分かると思いますが、Elasticsearchや検索エンジン等自体に問題があるというよりは使い所やチューニングを誤ると宝のもちぐされになるよという話です。念のため。

*2:... という体の、免責事項です。

*3:いきなり例のための例となってしまいました。どちらかといえば、RD部のWHERE句さんぐらいの方が良かったかもしれません。また、N-Gramとペアの例とした方が良かったかも。