2018-01-01から1年間の記事一覧
2018年にマイWebブラウザでブックマークしたページ(かつブックマークした際に有効そうだと思って、時間がたっても依然として有効だとおもいつつ、一方で、まだしっかり読み込めていないもの*1のおさらいです。 分野は雑食ですが、やや実用テック系多め。 ま…
はじめに 具体的にどうという話ではないのですが、一部の界隈では、貧弱な環境でgrepコマンドのみで様々なテキスト調査、下手をすれば人間をAIに見立てたNLPを実施しなければならんということが無いでしょうか。 貧弱な環境の解決にはなりませんが、もし近く…
Elasticsearchには、本分である検索もさることながらドキュメント(テキスト)に関する調査も可能です。 調査も...というか、Elasticsearchのような検索エンジンはテキストマイニングの情報技術の結集かと思いますので、テキストマイニングで出てくるような話…
私はどちらかといえば、Elasticsearchのkuromojiプラグインのkuromoji_part_of_speech についてはデフォルトのままで(つまり、stoptagsの設定は特に行わない)で良いのではないかと考えている派です。 が、当然ですが、案件ややりたいことによる訳で、なに…
MBA的な世界で出てくる様々なビジネスフレームワークですが、どうもすっきりしません。 私が成功した経営者や経営者でなくともMBAを修めた立場でであれば良いのですが、残念ながらそうではないので小声で言うと、多分本来の経営においてはさほど役に立たなそ…
はじめに この記事は、 itdepends.hateblo.jp のおおよその続編。 また、 itdepends.hateblo.jp itdepends.hateblo.jp の親戚記事です。 一言で言うと、「ナレッジインデックス(仮称)」というものを考えて、こいつの有効性を(実証は難しいものの)いくつ…
はじめに 弱者のエンジニアリング、細腕エンジニアとして、検索サイトのUX向上に向けて、せっかくある記事ページをナレッジインデックスとして検索に活かそうという論を主張します。 (Elasticsearchカテゴリとしたのは、Elasticsearchの機能にインスパイアさ…
最近学んだこと(原価を内容別に分類するという考え方がある) なにやら今更なんだけど、会計や経理の話はどうもしっくりこないところがしばしばある。 例えば↓のような記事。 globis.jp 結局どっちやねんという話。 知識不足・勉強不足の自分の主観なので、…
この人、何言ってやがるという時に感じる違和感の大半は、その人の発言とその人の行動のある種の矛盾からくるものが多いような気がする。 他人のとるにたらないミスを責める人は、むしろ大きな、周りにも迷惑のかかるミスをする。 別に相手の矛盾をついて、…
◯◯たるもの、嗜みの一つとして、Elasticsearchの日本語関連のAnalyze設定のフェイバリットのひとつ、ふたつはお持ちかと思います。 検索要件次第のところもありますが、そこがはっきりしない場合など、自分の脳内基本設定の軸があることで、それとの比較でト…
このブログでは検索サイトをテーマにしたりその延長線上でElasticsearchのオレオレ記事を書いていることが多いのですが、ここではのちのちElasticsearch関連で書きたい自説の前段として、Google Analyticsについてメモをまとめたのでそれを貼り付けてみます…
検索アプリエンジニアの立ち位置視点で、Elasticsearchのモニタリング全般やテーブル構造(テーブルではありませんが...、たとえ話として)、インデックスに抱えているデータをマシンルームのような制限がある場所で(※そのような状況が良いかは別に置いてお…
はじめに Elasticsearchのデータタイプのうち文字列系のtextとkeywordについて、それぞれを選択した場合の詳細Mapping設定での設定可能プロパティを表にして、これらの違いから、textとkeywordのデータタイプ自体の理解を深めることにしました。 文字列系デ…
はじめに Elasticsearchの検索やヒットの仕方をいろいろためしてみたいという時に、そもそものデータをどう用意するかというところは地味ながら悩ましいです。 というのも、bulk APIはあるものの、Elasticsearchは良くも悪くもJSONの世界観ですし、試したり…
はじめに ドキュメンテーションやドキュメントを元にした合意形成や他者への動機付けのアプローチについてご高説をたれてみます。 最近はドキュメンテーションのテクニックや手法は数多く有効な方法が提唱されていると思いますが、あともう一声言ってほしい…
はじめにのはじめに この記事では、検索サイトをインスタントに検討するときに、こんな形でサバきかたをしたらほどよく効率的・効果的なのではないかというところの自説をつらづらと書き綴ってみました。 (前置きが長いです。) はじめに: Elasticsearchの…
Elasticsearchのmatch系のクエリとterm系のクエリを、一覧にして比較してみました。 一覧にすることで、似たようなクエリで、あれ? これどっちだったけというところで振り返りやすくなると思いました。 検索フィールド指定と検索語で、それぞれ単複どう指定…
はじめに ElasticsearchのIngestNodeでのProcessorについて、現在のバージョン6.xで提供されている各編集機能を一覧にして逆引きしやすいようにしてみました。 寄り道の補足1 IngestNodeはインフラや非機能要件的にはポイントとなるお話があるとは思いますが…
はじめに Elasticsearchには、Suggestersといういわゆる検索BOXのオートコンプリート等に使える問い合わせのAPIがあるようです。 先人が様々なカタチで利用方法やTIPS等をまとめていただいています。 ただし、Suggerstersに限らないものの、製品がどんどん発…
ソフトウェア開発の方面では、顧客の本当に欲しかったものという有名な風刺絵(?)があります。 https://www.google.com/search?q=顧客が本当に欲しかったもの 私はこのイラストで表現された「あるある」が非常に好きなのですが、最近、もう少し狭い範囲ですが…
はじめに 題名のとおり、検索サイトの検索ページのURL体系についての考察をしてみた。 バックエンドがElasticsearchでの検索を想定しており、ElasticsearchでのクエリDSLへの繋がりが良さそうなものを...という意味ではそうなのだが、"Elasticsearch"という…
はじめに はじめに 7つの習慣 なぜなぜ分析 7つのムダ ECRS SCAMPER デザイン思考の5ステップ カスタマージャーニーマップ 共感マップ As is/ To Be 脈絡もなく、アイディア発想関連のビジネスフレームワークのイラストをアップしてみる。 なぜと言われると…
はじめに CMSを変更したり、おおよそ保持するテキストは変えないもののデザイン(htmlマーキングを含む意味)を変更した際に、現行の内容を移行漏れしていないことをざっくりテストしたいということはないだろうか。 この手のざっくり移行テストをするという…
ことの経緯 Redmineのwikiページ中に、issuesテーブル等を特定の条件で検索して、それを一覧表示したいということがあったのだが、リッチなプラグインを探して試すよりも作成した方が早かったので作成してみた。 うろ覚えであるが、Redmineのwikiでオレオレ…
はじめに 検索サイトの初学アプリ屋視点でElasticsearchがどんなものかザクッと知りたい・どんな感じのことができそうかという時がありませんか。 自分がググった範囲だと、シャードとかインフラ寄りの話、特定のユースケースに関する(非常に貴重ではあるが…
はじめに Elastisearchのマッピングの設定についてまとめてみた。 ここでは、typeやanalyzerなど他で詳しくとりまとめされているサイトがあるものは割愛し、その他の設定プロパティや、Dynamic Mapping(ダイナミックマッピング)、Index Template(インデッ…
はじめに(言い訳) 毎度、タイトルはでかく出たものの、その割になにか分からない感じですが、簡単に言うと、Elasticsearchで検索サイトを構築する時に、一発でなかなかうまくいかないこともあろうでしょうから、その時にどこをチューニングするかという話…
はじめに Elasticsearchの検索クエリのチートシートなど。 サクッとなんとなく掴んだ気になるためのリンク集。 あくまで検索クエリをテーマにしとります。インデックスの更新とかクラスターの管理のクエリは対象外。 (いろいろあって、最後に自分用に雑にま…
Geo Bounds Aggregation Geo Centroid Aggregation Geo Distance Aggregation GeoHash Grid Aggregation Global Aggregation Top Hits Aggregation Histgram Aggregation Nested Aggregation Significant Terms Aggregation Sampler Aggregation Elasticsear…
はじめに Elasticsearchで、システム管理・環境設計周りの話で、こんなことできるのかなみたいな気になったものを書き出して、確認した内容をメモる。 調べたい事項の備忘録も兼ねているので、で、結局どうなのさというものが常に残る可能性あり。 記事の拙…