win10增加變量(win10編輯系統(tǒng)變量窗口怎么調(diào))

前沿拓展：

win10增加變量

工具/原料

Java SE Development Kit 8u45安裝版
windows10官方版 v10.0.0.1013
方法/步驟

到官網(wǎng)下載jdk本人建議因為大部分安裝JDK的都是程序員我覺得來自這個樣子比較安全吧這個是本人地意見哈，進入jdk官網(wǎng)點擊OJAVA_HOME第二下面寫入你算安裝的路徑
新建path寫入jdk目錄

下面打開eclips使兩群稱車更e實驗下

隨著移動互聯(lián)網(wǎng)的普及以及人工智能技術(shù)的不斷發(fā)展，精準營銷的理念正逐步滲透到各行各業(yè)以及人們生活的方方面面。但是如何通過數(shù)據(jù)挖掘出“營銷敏感人群”，而不把成本浪費在“本來就會轉(zhuǎn)化”的那部分人身上，成為智能營銷時代的關(guān)鍵挑戰(zhàn)。增益模型（uplift model）是目前解決這一痛點最好的方法之一，本文將試圖通過該模型探討智能營銷的底層邏輯。

背景：問題先行

假設(shè)我們現(xiàn)在要搞一個優(yōu)惠券促銷活動，通過歷史數(shù)據(jù)預(yù)測了兩類用戶發(fā)券購買率和無券購買率的結(jié)果（見下圖），接下來我們想要對用戶發(fā)放優(yōu)惠券，這時會面臨一個必須要解決的問題：給哪類用戶發(fā)放優(yōu)惠券能夠使總收益最大化呢？

01 什么是增益模型（uplift model）

想要知道應(yīng)該給哪一類用戶發(fā)放優(yōu)惠券，我們需要搞清楚哪一類用戶對優(yōu)惠券**最敏感，換言之，也就是需要對用戶進行分類，了解每一類用戶的特點。在營銷活動中，對用戶進行主動干預(yù)稱為treatment，例如發(fā)放優(yōu)惠券是一次treatment。根據(jù)是否對用戶進行干預(yù)以及干預(yù)結(jié)果，我們可以將用戶分為以下四類：

Persuadables：基本只有在發(fā)券才會購買的人群，即優(yōu)惠券敏感人群；Sure things：無論是否發(fā)券，都會購買，自然轉(zhuǎn)化人群；Lost causes：無論是否發(fā)券都不購買，這類用戶難以**，直接放棄；Sleeping dogs：與Persuadables相反，對營銷活動比較反感，不發(fā)券的時候可能會購買，但發(fā)券后不會再購買。

對發(fā)放優(yōu)惠券這種有成本的營銷活動，我們不可能對所有用戶都發(fā)放補貼，這個成本是任何企業(yè)都無法承受的?？紤]到每個用戶對價格的接受程度是不一樣的，根據(jù)“營銷四象限人群”分布，我們希望模型觸達的是營銷敏感的用戶，即通過發(fā)放優(yōu)惠券促進用戶購買，而對于其他用戶，最好不要發(fā)券，這樣才能最大程度的節(jié)省成本。

我們再來看背景中的小例子，用戶2發(fā)券后購買率（1.6%）明顯高于用戶1（1.2%），似乎我們應(yīng)該對用戶2發(fā)放優(yōu)惠券，更能**其產(chǎn)生購買。但事實真的是這樣嗎？

假設(shè)用戶1和用戶2各1000人，不發(fā)券產(chǎn)品價格是100元，發(fā)放優(yōu)惠券后價格是80元，我們可以有四種方案：用戶1和2都發(fā)放優(yōu)惠券、用戶1和2都不發(fā)放優(yōu)惠券、1發(fā)2不發(fā)、2發(fā)1不發(fā)。我們分別來計算一下這四種方案帶來的總收益：

都發(fā)券：1000*1.2%*80+1000*1.6%*80=2240元都不發(fā)券：1000*0.7%*100+1000*1.4%*100=2100元1發(fā)2不發(fā)：1000*1.2%*80+1000*1.4%*100=2360元2發(fā)1不發(fā)：1000*0.7%*100+1000*1.6%*80=1980元

通過計算四種方案的收益，我們發(fā)現(xiàn)實際情況和預(yù)想的并不一樣，給發(fā)券購買率更高的用戶2發(fā)放優(yōu)惠券反而收益是最低的，這是為什么呢？

我們來進一步分析一下，除了發(fā)券購買率之外，我們還能知道這兩類用戶在沒有優(yōu)惠券情況下的自然購買率，根據(jù)這兩個數(shù)據(jù)能夠計算出發(fā)放優(yōu)惠券所帶來的增量效用。用戶1的發(fā)券購買率雖然低，但在沒有優(yōu)惠券刺**況下的購買率更低，即優(yōu)惠券所帶來的增量反而是比用戶2更高，而我們做營銷活動的目的是最大化總體的收益，本質(zhì)是最大化優(yōu)惠券的增量，因此我們應(yīng)該向用戶1發(fā)放優(yōu)惠券。

通過這個小例子，我們能夠得到一個結(jié)論：響應(yīng)模型（reponse model）能夠預(yù)測用戶的購買概率，但是該模型不能告訴我們這批人是否因為發(fā)放優(yōu)惠券而產(chǎn)生購買，這樣我們就無法區(qū)分營銷敏感（Persuadables）和自然轉(zhuǎn)化（Sure things）這兩類人群。也就是說響應(yīng)模型（reponse model）很有可能會誤導(dǎo)我們做出錯誤的決策。

而增益模型（uplift model）要做的就是幫助我們找到這些營銷敏感人群，準確判斷營銷干預(yù)所帶來的“增量提升”，從而促使營銷推廣效率的最大化，而不是把營銷預(yù)算浪費在“本來就會轉(zhuǎn)化”的那部分人身上。如果用一句話小編綜合來說增益模型（uplift model）：通過用戶分群的方法對用戶進行精細化運營的一種科學(xué)手段。

為了幫助大家更好的理解增益模型，我們構(gòu)造這樣一個場景：假設(shè)有N個用戶，Yi(1)表示我們對用戶i干預(yù)后的結(jié)果，比如給用戶i發(fā)放優(yōu)惠券后（干預(yù)）用戶下單（結(jié)果），Yi(0)表示沒有對用戶干預(yù)的情況下用戶的輸出結(jié)果，比如沒有給用戶i發(fā)放優(yōu)惠券（干預(yù)），用戶下單（結(jié)果）。如下圖所示：

那么，用戶i的因果效應(yīng)（causal effect）的計算如下：

增益模型的目標就是最大化這個增量，即有干預(yù)策略相對于無干預(yù)策略的提升，簡單講就是干預(yù)前后結(jié)果的差值。實際使用時會取所有用戶的因果效應(yīng)期望的估計值來衡量整個用戶群的效果，稱為條件平均因果效應(yīng)（Conditional Average Treatment Effect, CATE）。

上式中Xi是用戶i的特征，所謂的conditional指基于用戶特征。

(2)式是理想的增益模型計算形式，實際上，對一個用戶i我們不可能同時觀察到使用策略（treatment）和未使用策略（control）的輸出結(jié)果，即不可能同時得到Y(jié)i(1)和Yi(0)。因為對某個用戶，我們要么發(fā)優(yōu)惠券，要么不發(fā)。所以，我們可以將(2)式修改為：

其中Yi(obs)是用戶i可以觀察到的輸出結(jié)果，Wi是一個二值變量，如果對用戶i使用了策略，Wi=1，否則Wi=0。

在條件**的假設(shè)下，條件平均因果效應(yīng)的期望估計值是：

上式要滿足條件**（CIA）的條件，即用戶特征與干預(yù)策略是相互**的。

增益模型要優(yōu)化τ(Xi)，值越高越好。然而一個用戶不能同時觀察到使用干預(yù)策略和不使用干預(yù)策略的結(jié)果，因此τ(Xi)是難以直接優(yōu)化的。但如果通過AB實驗，可以獲得使用干預(yù)策略和不使用干預(yù)策略兩組人群，如果兩組人群的特征分布一致，可以通過模擬兩組人群的τ(Xi)得到個體用戶的τ(Xi)。因此增益模型依賴AB實驗的數(shù)據(jù)。

需要說明的一點是，增益模型（uplift model）是一組用于相同目的的建模方法的總稱。下面就給小伙伴們介紹三種常用的增益模型建模方法。

02 常用uplift建模方法2.1 雙模型(Two Model, T-Learner)

基礎(chǔ)模型仍是響應(yīng)模型，對uplift建模是間接的，模型效果還有提升空間無法滿足用戶特征與條件策略**的假設(shè)

2.3 Class TransformationMethod

另外一種更嚴謹?shù)目梢詫崿F(xiàn)實驗組對照組數(shù)據(jù)打通和模型打通的方法叫做class transformation method，可以直接優(yōu)化τ(Xi)。

模型公式

定義一個變量G∈{T, C}，G=T表示有干預(yù)，即實驗組（treatment），G=C表示無干預(yù)，即對照組（control）。uplift分數(shù)τ可以表示為：

為了統(tǒng)一表示實驗組和對照組都下單的情況(Y=1)，再定義一個變量Z，Z∈{0, 1}：

下面證明優(yōu)化(5)式相當(dāng)于優(yōu)化P(Z=1∣X)。

假設(shè)干預(yù)策略G與用戶特征X相互**，即G**于X：P(G∣X)=P(G)，(5)式可以轉(zhuǎn)寫為：

注意到P(G=T)和P(G=C)是可以通過AB實驗控制的，在隨機化實驗中，如果實驗組和對照組的人數(shù)是相等的，那么P(G=T)=P(G=C)=1/2，即一個用戶被分在實驗組（有干預(yù)策略）和被分在對照組（無干預(yù)策略）的概率是相等的。

在該假設(shè)下，(6)式可以改寫為：

由(7)式可得：

(8)式就是要計算的uplift score，此時只有Z一個變量，可以直接對Z=1建模，相當(dāng)于優(yōu)化P(Z=1∣X)，而不需要分別對實驗組P(T)和對照組P(C)單獨建模。而P(Z=1∣X)可以通過任何分類模型得到，所以這個方法稱為Class Transformation Method。

實際上，Z=1就是實驗組中下單的用戶和對照組中未下單的用戶，因此可以直接將實驗組和對照組用戶合并，使用一個模型建模，實現(xiàn)了數(shù)據(jù)層面和模型層面的打通。預(yù)測時，模型預(yù)測的結(jié)果就是uplift score，這點與差分響應(yīng)模型不同。

該方法需滿足以下兩個假設(shè)：

G與X相互**P(G=T)=P(G=C)=1/2，實踐中并不一定能嚴格滿足

03 如何評估uplift模型

根據(jù)uplift模型的定義，uplift score得分越高，代表該用戶增益就越大。但因為增益模型中不可能同時觀察到同一用戶在不同干預(yù)策略下的響應(yīng)，因此無法直接計算上述評價指標。增益模型通常都是通過劃分十分位數(shù)（decile）來對齊實驗組和對照組數(shù)據(jù)從而進行間接評估，而不是在一個測試集上直接評估。

接下來主要給家介紹三種主要的評估方法。

3.1 uplift 柱狀圖

測試集上，實驗組和對照組的用戶分別按照uplift由高到低排序，劃分為十等份，即十分位（decile），分別是Top 10%、Top 20% …… Top 100%用戶。分別對實驗組和對照組中每個十分位內(nèi)的用戶求E[Y(T)∣X(T)] 和E[Y(C)∣X(C)]，即預(yù)測分數(shù)的均值，第二相減，作為這個十分位bin內(nèi)的uplift，繪制柱狀圖，如下圖：

這種方法只能定性分析，無法計算出一個具體的值來整體評價模型的好壞。

3.2 Qini曲線（Qini curve）

可以在uplift bars的基礎(chǔ)上繪制曲線，類似AUC來評價模型的表現(xiàn)，這條曲線稱為Qini curve，計算每個百分比的Qini系數(shù)，最后將這些Qini系數(shù)連接起來，得到一條曲線。Qini系數(shù)計算如下：

?是按照uplift score由高到低排序的用戶數(shù)量占實驗組或?qū)φ战M用戶數(shù)量的比例，如?=0.1，表示實驗組或?qū)φ战M中前10%的用戶。

如上圖，藍色是隨機曲線，橙色是Qini曲線，Qini曲線與隨機曲線之間的面積作為評價模型的指標，面積越大，表示模型結(jié)果遠超過隨機選擇的結(jié)果，與AUC類似，這個指標稱為AUUC（Area Under Uplift Curve）。可以看到，當(dāng)橫軸等于0.6時，對應(yīng)的縱軸大概是0.0052(uplift score)，表示當(dāng)uplift score等于0.0052時，可以覆蓋前60%的用戶數(shù)量，這部分用戶就是營銷活動的目標用戶（persuadables）。

Qini系數(shù)分母是實驗組和對照組的全體用戶數(shù)，如果兩組用戶數(shù)量差別比較大，就會導(dǎo)致結(jié)果指標失真。另一種累積增益曲線可以避免這個問題。

3.3累積增益曲線（Cumulative Gain curve）

累積增益曲線計算如下：