RaNxxx’s blog

データまわりの知識やノウハウを紹介するブログです

【Tableau Tips】Tableau のカスタム形状を使い倒そう!

前書き Tableau の形状は様々な使い方がありますが、表の中に、カスタム形状を活用することで、ビジュアライズの幅がさらに広がることができます。 例えば、以下のような収支と進捗をまとめて管理したいときや、 Tableau による案件別の収支・進捗管理 顧客…

Tableauで表の中にドーナツチャートを作る方法

前書き Tableauでドーナツチャートの作り方に関する記事はいくつもありますが、キャプチャのように表の中にドーナツチャートが入って、各ディメンションが占める割合を表すドーナツチャートの作り方に関する分かりやすい紹介がなかったため、本記事を書こう…

高速な仮説検証のためのABテストの設計の流れ|後篇

個別のABテストの実施にあたって、事前になにを決めるか、どう決めるかを紹介するブログです。

商品分析の第一歩|商品カテゴリ別のLTV分析

実際の現場では、17種の商品カテゴリを扱う売り場の責任者が、 これから投資の最適化をするために、既存の商品カテゴリの中で、どのカテゴリに注力すべきかについて知りたがっています。 Tableauを使って以下にすばやく応えてあげるべきか、実演してみました…

Adobe Analytics|個別概算カウント(APPROXIMATE COUNT DISTINCT)で数が合わない理由

今日は同僚に、Adobe上で、Store IDをカウントして出したいけど、 Store IDをディメンションに適用して表示された行数 個別概算カウント機能でMetricsに適用して表示された値 が微妙に合わないのはなぜと聞かれました。 まず、結論からいうと、合わないのは…

ABテスティング環境の基盤理解のための専門用語まとめ

より正しいABテストを走らせるには、基盤の仕組みや動きを理解しなければ、そもそもAB設計のミスや基盤の障害が起きた時に、対応が不可能になります。 このブログでは、自分が最近受けたレクチャーに踏まえ、勉強メモとしてまとめさせていただいております。…

ABテストの設計の流れ|前篇

ABテストを言うと、ボタンを赤にするか緑にするかのイメージが強いですが、売上規模が一定以上のサービスにとって、施策によって、ほんの少しだけ予約率が下がってしまったら、数千万単位の売上損失に繋がってしまうことになるため、安易に施策を実施するこ…

インタラクションデザインについて理解しなければいけないことまとめ

本ブログは、「インタラクションデザインの教科書」をベースに整理し、自分の考えを加えたものとなります。自分の考えも入っているため、全部が正しいわけとは限りませんが、参考として読んで頂ければと思います。 インタラクションデザインの歴史と背景 イ…

ウェブ解析×SQL×Tableau|目指す第一歩、SQLによる顧客データ抽出

以前Googleのカンファレンスで下記のデータ分析のワークフローを聞いたことがあります。 実際のところ、この4つのフローを一気通貫行うというより、「収集→保存」のフェーズにフォーカスする人/部署、また、「加工/分析→可視化」のフェーズにフォーカスする…

Tableauでスパークラインと数字を同じ表に表示させる方法

データビジュアライズに関する初めての投稿となります。「ドキ(´Å`○)ドキ」 今日は、下記の表のように、スパークラインと数字が同じ表に表示させる方法を紹介したいと思います。 使っているデータは、相変わらずTableauのデフォルトのSuperstoreです。 スパ…

Tableau PublicビューをiFrameでサイトに埋め込む方法

最近は、「Information Dashboard Design」という本を読んでいて、これから学んだ知識をTableau上で再現し、このブログで紹介して行こうと思います。 その前に、Tableauで再現する以上は、Tableauのビューをどうサイトに埋め込むかについて、調べました。 せ…

LaTeXiTを利用する上のベーシックコツ|知らないと損をする!

最近はEvernoteで統計のメモを作っているので、数式や記号を書くのに悩んでいましたが、 つい先週末にLaTeXiTに手を出しました。笑 早速、LaTeXiTのインストールについて紹介します。 LaTeXiTのインストール ソフト自体は、LaTeXiT←こちらのリンクからダウン…

非エンジニアが効率的かつ高速にSQLを学習する方法

仕事のニーズもあり、6月末までにSQLを習得する目標を立てました。 最近はプライベートの時間を使って、SQLの勉強法をぐぐっていました。 非エンジニアの私は、プログラミングの勉強でも、ほかの数学や統計の勉強でも、 やはり概念を一通りに頭に入れながら…

pythonエラー|array must not contain infs or NaNs

array must not contain infs or NaNs の意味は、インプットされたarrayの中に、無限大(inf)または数値ではないデータ(NaNs = Not a Number)が入っているため、必要な処理ができません。 これを解決するには、1)インプットされたデータの中で、infまた…

文字列のtf-idfについて

tf-idfを紹介する前に、Bag of Words(単語の袋)を先に説明をしたいと思います。 Bag of Words(単語の袋) 簡単にいうと、Bag of Words はある文書における単語の出現回数を数えるアルゴリズムのことを指しています。 例をあげましょう。 この例では、名詞…

GTM(Google Tag Manager)を使って、ClientIDと初回訪問日を実装しましょう

久しぶりのGTM実装紹介です。 さてさて、ClientIDとユーザーの初回訪問日の実装方法は色々ありますが、 初心者に一番分かりやすく、再現可能な方法を紹介しようと思います。 まずは、ClientIDです。 clientIDの実装方法 こちらの元ネタの出所は、GTMの神様と…

5分で分かる!分散・共分散と相関係数

家で数学やら分散やらを騒いていたら、今日はようやく念願の数学講座を受けました。笑 さて、いつものように、勉強したことを纏めてみようと思います。 数学はとても久しぶりに触れたので、教わったことをググりながら纏めたものになるので、 不適切な説明や…

GitHubの第一歩|基本知識及びGitHubへのファイルプッシュ

初めてGitHubを知ったのは、去年の12月でした。 その時は、ちょうど機械学習(当時は、まだ人工知能という漠然とした概念)に可能性を感じはじめたところでした。 pythonすら理解していなかった私は、何かのきっかけで、GitHubを知りました。 でも、その時は…

勉強会メモ|Ngramによる言語モデル

言語モデル Ngramの説明をする前に、まずは言語モデルについて説明したく思います。 言語モデルとは、単語列が出現する確率を計算するモデルのことです。 例えば、「私は学校に行く」と「私は学校を行く」の2つランダムの単語列がある場合、後者の方は文法の…

機械学習|読書メモ MathWorksの「機械学習」資料

前ある機会で、MathWorksの機会学習のトレーニング資料を入手しました。 基礎知識があれば、もう一回この資料を流し読みすると、とてもとても分かりやすくて、知識が再度整理された感じでした。 そのため、「ここは知っといたほうがいいんだろう」と思った知…

GTM(Google Tag Manager)を使って、ページの指定場所までのスクロールを計測しましょう

コンテンツ分析の場合、ユーザーがページのどこまでスクロールして読んだかを知りたいことが多いでしょう。 ネットで一番流行っているのは、ページの何%までスクロールしたかの計測方法です。 この計測方法は、ブログや記事などに向いています。 何故ならば…

Python勉強|リスト

Pythonの勉強が暫く空いたので、今日は復習したリストの知識を纏めてみようと思います。 基礎知識 listの要素の追加 listは要素を [] で囲むもので、中には、文字列や数値を入れることもできれば、listをlistに入れることもできます。 例えば、list = ["Pyth…

Python勉強|ディクショナリ

今日はディクショナリの勉強をしました。そのメモをここで纏めます。 Python関連の文章は、自分の理解を深めるために、勉強したことを纏めたメモになります。 もし書いていることに、間違いがあったら、優しくご指摘ください。٩( 'ω' )و 基礎知識 dictの形式…

GTM(Google Tag Manager)を使って、サイト内の回遊を計測しましょう

サイトの回遊をどう計測するか、 Page/Sessionでサイトの回遊状況をざっくり把握することももちろんOKですが、 記事サイトやブログなどのサイトでは、 一個一個の記事コンテンツが、一体回遊にどれぐらい貢献したか? 記事を読んだユーザーが具体的にページ…