一端の何かになれるか

一生懸命は眩しい

2017-01-01から1年間の記事一覧

Seleniumでクローリングとスクレイピングを試す python

とにかく試して見るシリーズ第5弾。 前回、BeautifulSoupでスクレイピングを試したが、なんだかあまり活用する場面が思い浮かばんなあと思っていた。 同僚の方が普段使っているということで、手ほどきを受けながら挑戦した。 今回はソースコードの公開を控…

BeautifulSoupでスクレイピングを試す python

とにかく試して見るシリーズ第4弾。 今はあまり時間をかけられない+業務上必要なわけでもなく必要になりそうもないので、とりあえず触りだけ。 なぜやるのか pythonでできそうなことは試しておきたい。 それから、ようやくWeb系のデータに触れて行く機会を…

確率を学び直すにあたって

MathJax.Hub.Config({ tex2jax: {inlineMath: [['$', '$'], ['\\(', '\\)']]} }) ; 統計検定2級の学習を進めているが、基本的なところから曖昧な理解のままだったなと痛感。 なんとなくわかっていたつもりのことも、自分で手を動かしたり、誰かに説明しよう…

識別(分類)と回帰

分類(識別)と回帰を理解するのにちょっと戸惑ったのでメモ。 決定木分析とロジスティック回帰分析の理解度を深めようと振り返りをしていたところつまづいた。 Webで検索してみると書き手によってこちらの解釈が微妙に変わってしまい、ちょっとニュアンスが掴…

統計検定2級を受験する

統計検定とは 試験概要 資格の種類 日程 申し込み方法 2級の合格ラインと合格率 (おまけ)成績優秀者 2級の試験内容について詳しく なぜやるのか 曲がりなりにもデータアナリストを名乗りたいから 資格なんて取得しても役に立たない論 異論はない 要は役に…

scikit-learnでクラスタリング分析を試す

とにかく試して見るシリーズ第3弾。 有効な分析か否かに関わらず、全試行過程を掲載します。 誰も見てないと思うんですけど、「ここちゃんと意識したほうがいいよ」、「そこわかってないね全然ダメだよ」、とかコメントついたらむちゃくちゃ嬉しいです。 な…

scikit-learnでロジスティック回帰分析を試す

とにかく試して見るシリーズ第二弾。 ロジスティック回帰分析とは 概要 ロジスティック回帰分析でできること ビジネスでの活用例 取り組んだ課題 試行過程と結果 使えそうなデータセットを探す データセットを確認する データの入手元にあった各項目の説明 …

scikit-learnで決定木分析(CART)を試す

とにかく試して見るシリーズ第一弾。 なぜやるのか 決定木分析とは 概要 決定木分析の特徴 ビジネスでの活用例 取り組んだ課題 試行過程と結果 1.データセットを確認する 2.CSVデータを加工する 3.決定木の分類器を作成して可視化する 4.交差検証 感想 …

このままでは一端の何者にもなれない

ブログを始める。 何かに深い知見があるわけでもなく、不特定多数の誰かの為になるような記事をすぐには書けそうもない。 システムエンジニアからデータアナリストに転身してはや数ヶ月が経った。日常業務をこなすのに必要な最低限のキャッチアップを終え、…