朝日新聞の要約APIをたたくスクリプトを書いてみたよ

先日公開された朝日新聞の要約APIを試してみました。私が書いたスクリプトは以下。 長めの文章を「sample.txt」というファイルにまとめておくと、勝手に内容を読み込んで要約してくれます。 github.com スクリプト使用に際しての注意点 (1)APIキーが必要だ…

Wordファイルの表記統一が自動でできるスクリプトを書いたよ

先日、原稿の表記統一が自動でできるスクリプトを書きました。表記統一ルールをCSVファイルで定めておけば、原稿の文字列をそのとおりに置換してくれます。 tekitoeditor.hatenadiary.com 上記スクリプトはそこそこ便利ではありますが、テキストファイルの原…

原稿の表記統一が自動でできるスクリプトを書いたよ

最近はGoogleDocsの音声入力で取材音源の文字起こしをしている。作業が爆速で終わり、もはやこれ以外のやり方は考えられない。だが、この方法にはいくつかの問題がある。その一つが「表記が自分好みにならない」ってことだ。例を挙げよう。 色々 結構 多分 …

GoogleDocsの音声入力はよい、しかし……

何度挑戦しても正しく変換されない言葉がある。 これは音声で「Kaggle」を入力しようと試みた結果です。日本語的な発音でスタートし、徐々に英語的な発音に変えていきました。あまり意味がなかったのが一目瞭然ですね。 ちなみに「Google日本語入力に登録し…

最近グッときた形

駅でよく売られている某アイス。そのゴミ箱にはペットボトルなど他のゴミがよく捩じ込まれていた。おそらくはそれを受けてのことだろう。ゴミ箱の口が次のような形に変化していた。 写真ではサイズ感が伝わりにくいが、円形部分がちょうどペットボトル大で、…

Clubhouseで作った部屋の名前を一部晒しながら命名のコツを考えてみる

2月1日にClubhouseを始めてから、毎日複数の部屋を作り続けてきた。どれくらい人が来てくれるか、どんな会話が繰り広げられるかは部屋の名前や開設する時間帯によってさまざまだ。以下、部屋を作り続けるうちに気づいた命名のコツを、実際の部屋タイトルを晒…

『スッキリわかるSQL入門 第2版』ドリル(題材A・LEVEL6)の答え

『スッキリわかるSQL入門 第2版』のドリルを解き、ひたすら答えを載せていくシリーズです。今回は題材A・LEVEL6。手強かったです。 59. update 口座set 残高 =(select (sum(入金額)-sum(出金額)) as 残高 from 取引where 口座番号 = '0351333'and 日付 = '20…

『スッキリわかるSQL入門 第2版』ドリル(題材A・LEVEL5)の答え

『スッキリわかるSQL入門 第2版』のドリルを解き、ひたすら答えを載せていくシリーズです。今回は題材A・LEVEL5。SQL特有の書き方にも、だいぶ慣れてきました。 49. select sum(残高) as 残高の合計, max(残高) as 最大, min(残高) as 最小, avg(残高) as 平…

『スッキリわかるSQL入門 第2版』ドリル(題材A・LEVEL4)の答え

『スッキリわかるSQL入門 第2版』のドリルを解き、ひたすら答えを載せていくシリーズです。今回は題材A・LEVEL4。関数がまったく使いこなせていない……頑張るぞ! 34. select 口座番号, 残高/1000 as 千円単位の残高from 口座where 残高 >= 1000000 35. inser…

『スッキリわかるSQL入門 第2版』ドリル(題材A・LEVEL3)の答え

『スッキリわかるSQL入門 第2版』のドリルを解き、ひたすら答えを載せていくシリーズです。今回は題材A・LEVEL3。最後の33でつまずきました。 24. select *from 口座order by 口座番号 25. select distinct 名義from 口座order by 名義 26. select *from 口…

『スッキリわかるSQL入門 第2版』ドリル(題材A・LEVEL2)の答え

『スッキリわかるSQL入門 第2版』のドリルを解き、ひたすら答えを載せていくシリーズです。今回は題材A・LEVEL2。難易度的にはまだまだ平気です。かかってこーーーーい! 9. select *from 口座where 口座番号 = '0037651' 10. select *from 口座where 残高 >…

『スッキリわかるSQL入門 第2版』ドリル(題材A・LEVEL1)の答え

『スッキリわかるSQL入門 第2版』のドリルを解き、ひたすら答えを載せていくシリーズです。今回は題材A・LEVEL1で最も難易度の低いクエリ。これくらいならお茶の子さいさいだよ! 1. select 口座番号, 名義, 種別, 残高, 更新日 from 口座 2. select 口座番…

西暦を和暦に変換するGoogle日本語入力のユーザー辞書も作ったよ

先ほど和暦を西暦に変換するGoogle日本語入力のユーザー辞書を作成し、ブログで公開したところ、友人から「西暦を和暦に変換する需要のほうが多いのでは?」と指摘を受けました。それもそうだな~。というわけで、西暦→和暦バージョンも作ってみました。使い…

和暦を西暦に変換するGoogle日本語入力のユーザー辞書を作ったよ

ネットで行政文書を見ていると、年号が和暦になっており、ついイラッとしがちです。そうだ、和暦をすぐに西暦に変換してくれるツールを作ろう! というわけで、Google日本語入力のユーザー辞書を作りました。Google日本語入力にこの辞書をインポートし、和暦…

【松尾研データサイエンティスト育成講座】第3章・練習問題を解いてみた:単回帰分析編

松尾研「データサイエンティスト育成講座」も第3章に入りました。この章ではデータを落とし、手を動かしながら記述統計学と単回帰分析を学んでいきます。分析に使うのは主にPandas。めちゃめちゃ便利で大好きなライブラリです。さっそく練習問題を解いてみま…

【松尾研データサイエンティスト育成講座】第2章・練習問題を解いてみた:Matplotlib編

ちびちび進めてきた松尾研「データサイエンティスト育成講座」の第2章も今日で終わり。最後はMatplotlibに関する練習問題です。2.1.4 Matplotlibの基礎 y = 5x + 3 (xは-10から10の値)のグラフを書いてみましょう。 <練習問題 1の答え> import matplotlib.…

Pythonでグレンジャー因果推定をする

必要に迫られて、グレンジャー因果推定のコードをPythonで書いています。 調べてみると、以前はPandasにグレンジャー因果推定の関数が含まれていたようなのですが、現在はなくなってしまったらしい。うーん。代替手段はないのかな。日本語では十分な情報が出…

【松尾研データサイエンティスト育成講座】第2章・練習問題を解いてみた:Pandas編

松尾研「データサイエンティスト育成講座」の第2章では、データ操作に欠かせないライブラリの基礎を学びます。本日はそのうちの一つ、Pandasの練習問題を解いてみました。2.1.3 Pandasの基礎 以下のデータに対して、Moneyが500以上の人を絞り込んで、レコー…

【松尾研データサイエンティスト育成講座】第2章・練習問題を解いてみた:Numpy編

今回から「第2章 Numpy、Scipy、Pandas、Matplotlibの基礎」です。Numpy、Scipy、Pandas、Matplotlib。いずれもPythonによるデータ操作には欠かせないライブラリです。さっそく練習問題を解いてみました。 2.1.1 Numpyの基礎 <練習問題 1>1から50までの自然…

国会会議録検索システムから検索結果を取得するコードを書きました

国会会議録検索システムから検索結果を取得するコードを書きました。 kokkai.ndl.go.jp 国会会議録検索システムとは、1947年の第1回国会から現在に至るまでの国会議事録が検索できるデータベースです。今回のコードでは同データベースが公開しているAPIを利…

【松尾研データサイエンティスト育成講座】第1章・練習問題と総合問題を解いてみた

現在、東大・松尾研が公開中のコンテンツ「データサイエンティスト育成講座」に取り組んでいます。独りで勉強し続けるのは寂しく、モチベーションも保ちにくいため、このブログで学習過程を公開していくことにしました。 現在までに勉強し終えているのは「第…

【退屈なことはPythonにやらせよう】第5章 演習プロジェクト「ファンタジーゲームの持ち物リスト用にリストから辞書に移す関数」の答え

『退屈なことはPythonにやらせよう』という本に取り組み始めました。ここでは、同書各章の演習プロジェクトを解き、答えを載せていきます(正しいという保証はナシ)。今回は第5章「ファンタジーゲームの持ち物リスト」p.127です。

【退屈なことはPythonにやらせよう】第5章 演習プロジェクト「ファンタジーゲームの持ち物リスト」の答え

『退屈なことはPythonにやらせよう』という本に取り組み始めました。ここでは、同書各章の演習プロジェクトを解き、答えを載せていきます(正しいという保証はナシ)。今回は第5章「ファンタジーゲームの持ち物リスト」p.126です。

【退屈なことはPythonにやらせよう】第4章 演習プロジェクト「文字絵グリッド」の答え

『退屈なことはPythonにやらせよう』という本に取り組み始めました。ここでは、同書各章の演習プロジェクトを解き、答えを載せていきます(正しいという保証はナシ)。今回は第4章「文字絵グリッド」p.107です。

【退屈なことはPythonにやらせよう】第4章 演習プロジェクト「カンマ付け」の答え

『退屈なことはPythonにやらせよう』という本に取り組み始めました。ここでは、同書各章の演習プロジェクトを解き、答えを載せていきます(正しいという保証はナシ)。今回は、第4章「カンマ付け」p.107です。

【退屈なことはPythonにやらせよう】第3章 演習プロジェクトの答え

『退屈なことはPythonにやらせよう』という本に取り組み始めました。ここでは、同書各章の演習プロジェクトを解き、答えを載せていきます(正しいという保証はナシ)。今回は第3章p.78です。

ExcelでCSVを開く時に起きがちな文字化けの問題に対処する

データを扱っていると、CSVファイルをExcelで開く必要が出てきます。そんな時、文字化けが起きたりしますよね。だいたいは文字コードの違いが原因です。本日Excelで文字コードをShift-JISからUTF-8に変更する方法を知ったので、以下にまとめておきます。なお…