時系列解析モデルと聞くと、AIRMAモデルや状態空間モデルなどの数理統計学系のモデルをイメージする人も多いことでしょう。そして難しく感じた人も多いことでしょう。 時系列モデルは難しそうなイメージがありますが、あまり数理的...
ngrok(エングロック)を使うことで、ローカル(localhost)で動いているアプリケーションを、インターネットからアクセスできるように外部公開することができます。 ローカル(localhost)で動いているアプリと...
手元のデータを、直感的にさくっと集計したり、グラフ化したりし、ちらっと確認したいことあると思います。 Pythonで、直感的にさくっと集計したり、グラフ化したりするには、壁あります。コーディングという壁があります。コーデ...
CLTV(顧客生涯価値)は、有料顧客であり続ける全期間において、どれだけの金額をビジネスにもたらすかを示す指標です。 どの顧客のCLTV(顧客生涯価値)が高く、どの顧客のCLTV(顧客生涯価値)が低いのかを見積もることは...
自社商品やサービスが、どの顧客セグメントに対し強いのか弱いのか、ポテンシャルが高いのか低いのかを示す指標が、構築指標です。 2種類あります。 カテゴリー構築指数 ブランド構築指数 計算式はどちらも簡単です。1顧客あたりの...
scikit-learnのモデルをOptunaでCV(クロスバリデーション)を実施する方法は2種類あります。 良し悪しを判断するメトリクスにscikit-learnのCVを指定する方法 OptunaのCV関数(Optun...
生存時間分析とは…… 生物の死 顧客の離反 機械システムの故障 ……など、あるイベント(例:死、離反、故障など)が発生するまでの時間(期間)を推測するための統計学的なデータサイエンス技術です。 ここでは、顧客の離反までの...
簡単に計算できそうでできない指標の1つに、市場シェアという指標があります。 市場をどのように定義するのかで値は変わってきますし、市場シェアの計算単位を金額で考えるのか数量で考えるのかでも値は変わってきます。 市場計算する...
離反時期や故障時期などを分析する生存時間分析を実施する手段は色々ありますが、生存時間用のライブラリーを活用するのがいいでしょう。 今回利用するのは、LifelinesというPythonのライブラリーです。 生存時間分析ラ...
生存時間分析とは…… 生物の死 顧客の離反 機械システムの故障 ……など、あるイベント(例:死、離反、故障など)が発生するまでの時間(期間)を推測するための統計学的なデータサイエンス技術です。 詳細というか概要を以下の記...
質問です。 あなたの会社の顧客が、顧客である期間はどのくらいですか? この顧客は何年後に離反しますか? もう1つ質問です。 あなたの会社の機械(もしくは、顧客の機械)が、1年間正常に稼働した後、どのくらい持ちますか? こ...
機械学習などの数理モデルには、通常幾つかのハイパーパラメータがあり、そのハイパーパラメータの設定次第で大きく精度が変わります。 このハイパーパラメータを調整し最適な設定を探すタスクを、ハイパーパラメータチューニングと言い...
機械学習などの数理モデルには、通常幾つかのハイパーパラメータがあり、そのハイパーパラメータの設定次第で大きく精度が変わります。 このハイパーパラメータを調整し最適な設定を探すタスクを、ハイパーパラメータチューニングと言い...
定額課金のサブスクビジネスでよく活用される指標にMRR(Monthly Recurring Revenue)を元に計算するQuick Ratioという指標があります。 このQuick Ratioは、経営分析などで利用され...
売上などのビジネス系のデータの多くは、時間概念が紐付いた時系列データです。 時間概念を取っ払ったテーブルデータと異なり、時系列データは、過去の値に大きく依存する、という特徴があります。そのため、一工夫必要になります。例え...
データを手に入れたとき、集計や分析、数理モデル構築などをする前に、前処理をしデータをキレイにする必要があります。 前処理を適切に行わないと、間違った何かを出力することになります。 では実際どのようなことをするのか? 今回...