異動でデータサイエンティストになったので、せめて「統計検定2級くらいの実力はつけたいな」と思い、勉強を始めました。 「統計検定2級の受験」といえば、評判の高い教材がいくつかあります。たとえばこれ。 bellcurve.jp BellCurveさんの「統計学の時間」…
この4月、異動でデータサイエンティストになりました。「ド文系の自分が、40代後半でこんなジョブチェンジをするとは思わなかったぜ」とびっくりしています。 大学院ではプログラミングと統計を学び、なぜかよい成績をおさめたものの、当然ながら実力には自…
本ブログのメンテをしている最中、3年前に作った下書きを発見しました。題して「イケてるSaaS企業の探し方をIT系メディアの記者さんに教えてもらったから共有するね」。当時、諸事情あってそんなリサーチをしていたと思い出しました。ざっと読んだところ、Sa…
「今年は発注されていない文章を量産するぞ」と決意したにもかかわらず、まったく書けていません。ブログの更新も約1か月ぶりです。 やー、怒涛の日々でしたね。しかし、自分の人生を振り返ると、ずっと怒涛の日々なので、天寿をまっとうするまでこの状態が…
昨年末体調を崩し、縄文文化への興味を一時的に失っていました。体力が落ちると気力も落ちるんですね。おかげさまで最近は元気を取り戻し、縄文への情熱もよみがえっています。以下は2023年1月に行った縄文関連の活動です。 1月に観た展示 杉並区立郷土博物…
最近出かけると、なぜか弁才天ゆかりの地にたどり着く。しかし有名な不忍池辯天堂にはお参りしたことがない。そこで先日行ってみると、境内が石碑だらけだった。 魚塚。東京魚商業協同組合が建てたらしい。 めがね之碑。デザインされているのは徳川家康のめ…
現在は2023年1月13日だ。つまり、2023年が明け、しばらく経つ。その間、自分なりに新年の目標は立てた。しかし、自分ひとりの胸のうちにそれを秘めていては、2022年以前と何ら変わらない日々が続くだろう。そこで、誰も読まないかもしれないが、多くの人の目…
以前作った以下2つのGoogle日本入力ユーザー辞書をアップデートしました。 tekitoeditor.hatenadiary.com tekitoeditor.hatenadiary.com 今回のバージョンでは、和暦の切り替え日を入れています。 例1)和暦→西暦辞書で大正1年の西暦を知りたい場合 「たいし…
最近、仕事で行政の統計を見ることが多い。「行政の統計」といえば「e-Stat」。そういえば同サイトではAPIを公開していたなと思い、触ってみることにした。同APIの利用にあたっては、ユーザー登録をし、アプリケーションIDを取得する必要がある。詳細は以下…
先日公開された朝日新聞の要約APIを試してみました。私が書いたスクリプトは以下。 長めの文章を「sample.txt」というファイルにまとめておくと、勝手に内容を読み込んで要約してくれます。 github.com スクリプト使用に際しての注意点 (1)APIキーが必要だ…
先日、原稿の表記統一が自動でできるスクリプトを書きました。表記統一ルールをCSVファイルで定めておけば、原稿の文字列をそのとおりに置換してくれます。 tekitoeditor.hatenadiary.com 上記スクリプトはそこそこ便利ではありますが、テキストファイルの原…
最近はGoogleDocsの音声入力で取材音源の文字起こしをしている。作業が爆速で終わり、もはやこれ以外のやり方は考えられない。だが、この方法にはいくつかの問題がある。その一つが「表記が自分好みにならない」ってことだ。例を挙げよう。 色々 結構 多分 …
何度挑戦しても正しく変換されない言葉がある。 これは音声で「Kaggle」を入力しようと試みた結果です。日本語的な発音でスタートし、徐々に英語的な発音に変えていきました。あまり意味がなかったのが一目瞭然ですね。 ちなみに「Google日本語入力に登録し…
駅でよく売られている某アイス。そのゴミ箱にはペットボトルなど他のゴミがよく捩じ込まれていた。おそらくはそれを受けてのことだろう。ゴミ箱の口が次のような形に変化していた。 写真ではサイズ感が伝わりにくいが、円形部分がちょうどペットボトル大で、…
2月1日にClubhouseを始めてから、毎日複数の部屋を作り続けてきた。どれくらい人が来てくれるか、どんな会話が繰り広げられるかは部屋の名前や開設する時間帯によってさまざまだ。以下、部屋を作り続けるうちに気づいた命名のコツを、実際の部屋タイトルを晒…
『スッキリわかるSQL入門 第2版』のドリルを解き、ひたすら答えを載せていくシリーズです。今回は題材A・LEVEL6。手強かったです。 59. update 口座set 残高 =(select (sum(入金額)-sum(出金額)) as 残高 from 取引where 口座番号 = '0351333'and 日付 = '20…
『スッキリわかるSQL入門 第2版』のドリルを解き、ひたすら答えを載せていくシリーズです。今回は題材A・LEVEL5。SQL特有の書き方にも、だいぶ慣れてきました。 49. select sum(残高) as 残高の合計, max(残高) as 最大, min(残高) as 最小, avg(残高) as 平…
『スッキリわかるSQL入門 第2版』のドリルを解き、ひたすら答えを載せていくシリーズです。今回は題材A・LEVEL4。関数がまったく使いこなせていない……頑張るぞ! 34. select 口座番号, 残高/1000 as 千円単位の残高from 口座where 残高 >= 1000000 35. inser…
『スッキリわかるSQL入門 第2版』のドリルを解き、ひたすら答えを載せていくシリーズです。今回は題材A・LEVEL3。最後の33でつまずきました。 24. select *from 口座order by 口座番号 25. select distinct 名義from 口座order by 名義 26. select *from 口…
『スッキリわかるSQL入門 第2版』のドリルを解き、ひたすら答えを載せていくシリーズです。今回は題材A・LEVEL2。難易度的にはまだまだ平気です。かかってこーーーーい! 9. select *from 口座where 口座番号 = '0037651' 10. select *from 口座where 残高 >…
『スッキリわかるSQL入門 第2版』のドリルを解き、ひたすら答えを載せていくシリーズです。今回は題材A・LEVEL1で最も難易度の低いクエリ。これくらいならお茶の子さいさいだよ! 1. select 口座番号, 名義, 種別, 残高, 更新日 from 口座 2. select 口座番…
先ほど和暦を西暦に変換するGoogle日本語入力のユーザー辞書を作成し、ブログで公開したところ、友人から「西暦を和暦に変換する需要のほうが多いのでは?」と指摘を受けました。それもそうだな~。というわけで、西暦→和暦バージョンも作ってみました。使い…
ネットで行政文書を見ていると、年号が和暦になっており、ついイラッとしがちです。そうだ、和暦をすぐに西暦に変換してくれるツールを作ろう! というわけで、Google日本語入力のユーザー辞書を作りました。Google日本語入力にこの辞書をインポートし、和暦…
松尾研「データサイエンティスト育成講座」も第3章に入りました。この章ではデータを落とし、手を動かしながら記述統計学と単回帰分析を学んでいきます。分析に使うのは主にPandas。めちゃめちゃ便利で大好きなライブラリです。さっそく練習問題を解いてみま…
ちびちび進めてきた松尾研「データサイエンティスト育成講座」の第2章も今日で終わり。最後はMatplotlibに関する練習問題です。2.1.4 Matplotlibの基礎 y = 5x + 3 (xは-10から10の値)のグラフを書いてみましょう。 <練習問題 1の答え> import matplotlib.…
必要に迫られて、グレンジャー因果推定のコードをPythonで書いています。 調べてみると、以前はPandasにグレンジャー因果推定の関数が含まれていたようなのですが、現在はなくなってしまったらしい。うーん。代替手段はないのかな。日本語では十分な情報が出…
松尾研「データサイエンティスト育成講座」の第2章では、データ操作に欠かせないライブラリの基礎を学びます。本日はそのうちの一つ、Pandasの練習問題を解いてみました。2.1.3 Pandasの基礎 以下のデータに対して、Moneyが500以上の人を絞り込んで、レコー…
今回から「第2章 Numpy、Scipy、Pandas、Matplotlibの基礎」です。Numpy、Scipy、Pandas、Matplotlib。いずれもPythonによるデータ操作には欠かせないライブラリです。さっそく練習問題を解いてみました。 2.1.1 Numpyの基礎 <練習問題 1>1から50までの自然…
国会会議録検索システムから検索結果を取得するコードを書きました。 kokkai.ndl.go.jp 国会会議録検索システムとは、1947年の第1回国会から現在に至るまでの国会議事録が検索できるデータベースです。今回のコードでは同データベースが公開しているAPIを利…
現在、東大・松尾研が公開中のコンテンツ「データサイエンティスト育成講座」に取り組んでいます。独りで勉強し続けるのは寂しく、モチベーションも保ちにくいため、このブログで学習過程を公開していくことにしました。 現在までに勉強し終えているのは「第…