はてだBlog(仮称)

私的なブログど真ん中のつもりでしたが、気づけばWebサイト系のアプリケーション開発周りで感じたこと寄りの自分メモなどをつれづれ述べています。2020年6月現在、Elasticsearch、pandas、CMSなどに関する話題が多めです。...ですが、だんだんとより私的なプログラムのスニペット置き場になりつつあります。ブログで述べている内容は所属組織で販売している製品などに関するものではなく、また所属する組織の見解を代表するものではありません。

大体あっている

ElasticsearchのAggsで「グループ内で最大値をとるレコードを抽出する」風の実現例(邪道流)

はじめに Elasticsearchでは、SQLでいうところのGROUP BYに近い挙動となるAggregationsというクエリがあります。 ここ何回かの過去記事でもAggregationsをちょいと雑に俯瞰する記事を投稿しました。 itdepends.hateblo.jp なおこのAggregationsですが、GROUP…

Elasticsearch のmatch_phraseで多少のあいまい度を許容する姑息なアイディア例

はじめに Elasticsearchのmatch_phraseで語順を意識して検索したいけど、多少は外れてたやつも下位で良いのでヒットさせたいよねという例をサカナにanalyzeの頭の体操をしてみましたの例です。 確認はver6.8で実施しましたが、基本は7系でも動作すると思いま…

BM25を分かった気になるかもしれない邪道な解説(?)

1. はじめに このブログではElasticsearchについて時々思い出したように書きなぐっております。 そしてこの記事では、Elasticsearchのデフォルトのスコアリング方式であるBM25について、数式が苦手でも、なんとなく分かった気になる(かもしれない)解説を試…

「街区レベル位置参照情報」を使って市区町村を囲むような長方形の4角の緯度経度を算出する体でのPandasとLeafletのサンプルプログラム

はじめに 行政が公開している「街区レベル位置参照情報」というデータを使って、↓こんな感じで、ある市区町村を囲むような4角形の矩形をあぶりだせないか試してみました。 ... という体裁をとった、PandasとLeafletのサンプルプログラムを動かしてみた・やっ…

矛盾を表すコトバ

この人、何言ってやがるという時に感じる違和感の大半は、その人の発言とその人の行動のある種の矛盾からくるものが多いような気がする。 他人のとるにたらないミスを責める人は、むしろ大きな、周りにも迷惑のかかるミスをする。 別に相手の矛盾をついて、…

Webサイトのコンテンツ移行のテスト(デジタルだけどアナログな世界) pyquery、requests

はじめに CMSを変更したり、おおよそ保持するテキストは変えないもののデザイン(htmlマーキングを含む意味)を変更した際に、現行の内容を移行漏れしていないことをざっくりテストしたいということはないだろうか。 この手のざっくり移行テストをするという…

大丈夫だ問題ない(今後の扱いを表す言葉・パターン)

大人の世界で生きていると、多少の問題があっても「大丈夫だ問題ない」と回答することになるケースがある。 怒らないから本当のこと言いなさいと優しいママに言われたとしてもだ。 コンプライアンス的にまずいようなものはいかんが、ウソをつかずに何かの圧…

大体あっている(構造や形、あるいは建付を表現することば)

わかりやすい表現についてわれ思う 専門的なことや一般的でないことを、分かった気ではなく、ちゃんと分かって欲しい時がしばしばある。 ただ、本題は分かってもらった先にあるので、前段の専門的な話や前提についてできるだけ負担をかけずに伝えたい。 全て…

大体合っている表現集というものはないのか

ある偉人や演説家の英語は、小学生でも分かる単語だけで作られているものも多いと耳にする。 とはいえ、世の中そんな単純でもないだろうし、小学生で習う語彙では表現しづらい内容もあるだろう。 シンプルなのは良いとして、シンプルにしすぎて意味を損なっ…

大体合っている論法(ソフトウェアを建築で例えても問題ないパターン)

ソフトウェアを建築になぞらえることはもちろんやめた方が良い。今やこれは常識。 ただ、ソフトウェアに関するある営みが「うまくいっていない・いかないだろう理由」を建築に例えるのはアリだと思う。 こんな状況だと家もガタガタになりますよね、ソフトウ…