RaNxxx’s blog

データまわりの知識やノウハウを紹介するブログです

2018-01-01から1年間の記事一覧

ウェブ解析×SQL×Tableau|目指す第一歩、SQLによる顧客データ抽出

以前Googleのカンファレンスで下記のデータ分析のワークフローを聞いたことがあります。 実際のところ、この4つのフローを一気通貫行うというより、「収集→保存」のフェーズにフォーカスする人/部署、また、「加工/分析→可視化」のフェーズにフォーカスする…

Tableauでスパークラインと数字を同じ表に表示させる方法

データビジュアライズに関する初めての投稿となります。「ドキ(´Å`○)ドキ」 今日は、下記の表のように、スパークラインと数字が同じ表に表示させる方法を紹介したいと思います。 使っているデータは、相変わらずTableauのデフォルトのSuperstoreです。 スパ…

Tableau PublicビューをiFrameでサイトに埋め込む方法

最近は、「Information Dashboard Design」という本を読んでいて、これから学んだ知識をTableau上で再現し、このブログで紹介して行こうと思います。 その前に、Tableauで再現する以上は、Tableauのビューをどうサイトに埋め込むかについて、調べました。 せ…

LaTeXiTを利用する上のベーシックコツ|知らないと損をする!

最近はEvernoteで統計のメモを作っているので、数式や記号を書くのに悩んでいましたが、 つい先週末にLaTeXiTに手を出しました。笑 早速、LaTeXiTのインストールについて紹介します。 LaTeXiTのインストール ソフト自体は、LaTeXiT←こちらのリンクからダウン…

非エンジニアが効率的かつ高速にSQLを学習する方法

仕事のニーズもあり、6月末までにSQLを習得する目標を立てました。 最近はプライベートの時間を使って、SQLの勉強法をぐぐっていました。 非エンジニアの私は、プログラミングの勉強でも、ほかの数学や統計の勉強でも、 やはり概念を一通りに頭に入れながら…

pythonエラー|array must not contain infs or NaNs

array must not contain infs or NaNs の意味は、インプットされたarrayの中に、無限大(inf)または数値ではないデータ(NaNs = Not a Number)が入っているため、必要な処理ができません。 これを解決するには、1)インプットされたデータの中で、infまた…

文字列のtf-idfについて

tf-idfを紹介する前に、Bag of Words(単語の袋)を先に説明をしたいと思います。 Bag of Words(単語の袋) 簡単にいうと、Bag of Words はある文書における単語の出現回数を数えるアルゴリズムのことを指しています。 例をあげましょう。 この例では、名詞…

GTM(Google Tag Manager)を使って、ClientIDと初回訪問日を実装しましょう

久しぶりのGTM実装紹介です。 さてさて、ClientIDとユーザーの初回訪問日の実装方法は色々ありますが、 初心者に一番分かりやすく、再現可能な方法を紹介しようと思います。 まずは、ClientIDです。 clientIDの実装方法 こちらの元ネタの出所は、GTMの神様と…