如果你在過去的幾年中參加過像是“Ad-tech”這樣的和網際網路有關的大型會議,你就肯定聽過這樣的口號: 他們說:
但是很奇怪,關於測試技術,卻連最基本的指導書和操作資訊都沒有。Google Adwords在測試頁面登陸時採用了很明顯的錯誤的方法,但是還是有很多人延用這種錯誤的方法,也有人試圖使用他們自己的方法,但最終也只能得出一般性的結論。
擺在面前的事實很簡單:得出錯誤的資料要比一點資料都沒有還要糟糕。假如我站在離懸崖三英尺的地方,可是我的資料告訴我,我是站在四英尺以外的,那我就有可能接著前進進而踏上死路。這樣看來,我還不如原地不動的好。
和以上那個例子相同,很多不正確的測試結果也給很做萬能網路的人帶來極大的困難。本書將給你提供相關的理論和例子,使你得到最佳的測試結果,並且使這些結果為你帶來相應的利益。
我認為最大的問題是人們常常把測試看的太簡單了。只是簡單地在網上放一些網頁就去等待結果,這樣得到的結果絕不會多真實。
我們的第一條建議是:為了取得更多收益進行測試和最優化網站應該有一條明確的指導原則。裏面應該有上百條小要點、方法,以及從上千次在比如分裂實驗設計、對電子商務網站的測試等方面進行分裂實驗和多變數實驗中得出的經驗。
你會注意到本書不會在“田口式實驗計畫法”、“ 多變數實驗”和“分裂實驗”中花費太多的時間。這些方法是很重要,我會有一整章來講述這些。但是最終你的測試成功與否取決與你測試的內容。我用“GIGO”這個縮略詞來總結我的意思“進去的是垃圾,出來的也是垃圾”,如果你在測試過程中用上了這個理論,你就會得到更好的結果。
你可以一部分一部分地詳讀,也可以大致流覽。對大部分人,我建議從頭至尾通讀。就我的經驗看來,測試這種東西只是表面上看起來很簡單,實際上有很多你自己都沒意識到的不明白的東西。
要注意我在書中用了很多時間來說測試方法,而不是通篇只關注某一種方法。
在我看來A/B測試法和多變數測試法在不同的情況下都是有用的。至於你選擇哪一種,這要取決於你自己的目標、流量和預算。如果你想詳細瞭解田口式實驗法,會有其他的書來仔細說明。如果你只是想更多的瞭解一點在網上賺錢的方法和測試法,那我們這本書就正適合你。
這些年來,我發現很多人在測試時都會犯極嚴重的錯誤。這些錯誤會導致:非決定性的結果、不正確的資料,並最終引起虧損。同時我還發現人們在犯同一類型的錯誤。希望通過我書的的解釋和提供的解決方法,可以避免這些錯誤再次發生。
這種方法被那些自以為是的網路專家推薦使用很多年了。Google自己也在推薦使用。翻到“為什麼使用Google Adwords測試會帶來錯誤的測試結果”這一節來看這個方法的問題究竟是在哪里。
許多測試新手傾向于使用兩個完全不同的頁面設計,這樣做基本上都不會有什麼好的效果。翻到“測試頁面還是測試元件”來看原因。
在你的整個網站上主頁通常都是最難測試的那部分,然而也是許多人開始進行測試的那部分,翻到“測試你的主頁”看原因
很多新手沒有找到正確的測試元素。關於這一點可以讀“高影響力元件”來學習從哪里能找到最好的切口。
得到經過銀行帳戶證實的可靠結果是許多測試的人的首選。“試樣量和分析的正確性”這一節來學習在何時結束測試。
用最小的流量就得到可靠的測試結果的秘密之一就是“結果革命”。關於這一點 “語意分類”這一節會詳細談到。
每個人都在說要提高轉換率,但是轉換率真是你成功的標準麼?最好的標準又是什麼呢?這些你會在“成功標準”這一節找到答案。
一個第三方cookie做為一種跟蹤碼已經使用了很多年,在“第三方的cookies”裏你會明白為什麼只依靠這一點是不夠的。
潛在轉換在所有的活動中占了很大的比例。在“潛在轉換”中會有詳細內容。
雜音指的是你在測試過程中無法控制的變化。雜音會使結果不很可靠,也會樣試樣量更多。“研究雜音”,學習如何減少它對實驗的影響。
一個測試條款為一次科學的測試提供詳細的計畫。裏面包括有測試假定的結果,方法和規則。你每進行一次測試都應制定一個相應的測試條款。
真實世界”測試條款
當一種新藥研究出來後要經過嚴格的檢測。首先會在實驗室裏檢測,之後會用小白鼠做實驗。然後,即使已經可以在人身上進行了,也只會有一小部分人在嚴格控制下接受實驗。 這樣的測試條款是為了盡可能地消除雜音,並且控制住外界事物對實驗本身的影響。 你選用的測試條款將會對你的測試成敗與否產生很大的影響。你要做的最重要的事是確定你有這樣的條款,並且堅持按條款來做。
不管你是 進行簡單的分裂實驗還是複雜的多變數實驗,這樣的條款都很重要。條款中的很多內容會在所有的測試的過程中被反復使用。但是為每一次的測試單獨制定一個條款還是有必要的,因為每次的測試總是會有些不同之處。
這一章會深入的解釋條款中的一些內容。讓我們看一下一個條款裏應該包括哪些內容:
測試名字: eroadwarrior網站的點擊率 測試日期: 2006年6月2日—2006年7月2日 測試類型: V—4多邊量測試 測試內容: 我們主要測試三個不同的因素:標題、對動態頁面的點擊和右下角的鏈結塊。 你的目標: 增加點擊 基礎回復率: 目前還不知道,會在稍後測試。 你的假設: 我認為一個好的標題會比只使用產品名稱更有用,同時還認為一個鏈結塊能增加轉換率,它將是測試中最重要的一部分。 預期中會出現的雜音: 因為這是一種商業產品,季度購買不會有很大的影響,但是月購買就有很大的關連,所以測試會進行一個整月。 潛在的轉換: 潛在轉換可能會很小,因為我們看的是點擊率。 跟蹤監測的方法和所使用的軟體: 我們使用第一方跟蹤cookie和vertster網站的測試工具來進行這次測試。 測試管理人的名字: 司克特.米勒
為了測試和最優化一個頁面,你必須有一個可以測量的目標,這樣才能對此進行跟蹤和分析。我將此稱為“成功標準”。沒有一個可以測量的目標,就無法判定哪一些方法更好,
“成功標準”概述:
“成功標準”也通常被稱為信號或是反應。要是你聽見一個人說頁面反應,他們是在說頁面的運行情況怎麼樣。同樣,要是你聽見人說信號,那是在說成功標準。
田口式實驗法使用一種叫做“信號—雜音”的方法。這是一種比例,也被稱為環境雜音。你 將從下面的截圖裏學到更多有關雜音的東西。
你的轉換率是指可能會在你的網站上進行活動的人的比例。許多公司用網路來積聚leads。在這樣的情況裏,一次興趣的交易就是一個完成了的lead的形式,網路上的潛在顧客通常是那些興趣獨特的訪客。
假如你正在辦一份電子雜誌,那麼,一次轉換就是一個人訂了你的雜誌。許多人都利用去計算、提升不同的轉換率。
計算轉換率有一個簡單的公式:
總轉換量/總訪問量*100=轉換率
銷售轉換率是標準的轉換率的衍生物,它指的是一次完成了的現金業務,它可以這樣計算:
所有的銷售交易/總訪問量*100=銷售轉換率(sCR)
任何時候你在網上真正出售東西的時,都要建立跟蹤銷售轉換。這一點有一系列的步驟,首先是某個人把一樣東西放進了購物車,一直到使用的程式都完成了,這次銷售交易才算是完成。
注意:除非你只賣一樣東西,否則,銷售轉換率就不一定是你衡量最優化的標準。在電子商務裏,每位元訪客的銷售額是你最應該關注的。
網路銷售商最熟悉的就是點擊率,在決定你在哪里投放廣告和投入資金方面,點擊率都扮演著很重要的角色。
點擊率是衡量有多少人點擊某一個鏈結,這個鏈結可以是你的主頁上的一個鏈結,也可以是橫幅廣告,等等。
它是這樣計算的:
所有點擊數/所有的訪問數*100=CTR
如果你想最優化某個鏈結、橫幅廣告、按紐、甚至是加盟鏈結時,點擊率就是最好的選擇。
專家提醒:
如果你想用分裂和田口式來提高你的Adwords 點擊率,你最好看看BetterPPC這本書,裏面有關於如何最優化PPC廣告的點擊率的非常好的計畫。
註冊率是那些用來弄清為了得到“它”而在網上待了足夠久的時間的人有多少。“它”是什麼?答案是很主觀的,但是一般是會讓人停留超過五秒鐘的東西。網上有一些東西讓他們很感興趣,所以他們要留在這個網站看完全部內容。
它和蹦失率恰恰相反。我們一方面在想辦法降低蹦失率,一方面又要設法提高註冊率。
下面的這個等式可以計算註冊率:
停留了X秒的訪客/總訪客量*100=註冊率(ER)
儘管大多數的測試都是圍繞著轉換率而進行的,可我還是相信客戶回復的增長主要還是來自於註冊率的提高。如果頁面速度很快,會對提高註冊率有很大的幫助。
每時段的頁面流覽量可以用來衡量網站粘性,還能顯示你的網站在吸引住顧客方面的表現,它的計算公式很簡單:
流覽量/一個時段=每時段的頁面流覽量
如果你出售的是CPM廣告,這是一個很值得你去優化的一項測試標準。一般的說,你的網站頁面流覽量越高,你的廣告效應就越好,你也就會掙到更多的錢。
想增加每時段的頁面流覽量需要測試不同的定位結構、廣告位置和內容的層次。
平均時長是另一個網站粘性的標準。它指的是一位元客戶在你的網站上花費的平均時間是多久。 所有客戶花費的時間/客戶總數=平均時段
一些網站每五秒或是再多一些的時間迴圈播放橫幅廣告。廣告通常以CPM為基礎來出售。毫無疑問,人們在你的網站上待的時間越長,他們就會看到越多的橫幅廣告,那麼網站也就會賺到越多的錢。
平均訂單值是一種電子商務的標準,它指的是每一位元客戶完成的平均交易額。計算公式是: 總訂購額/總訂購人數=平均訂單值(AOV)
如果你可以在不減少訂購數的情況下增加平均訂單值(AOV),那麼每位訪客的銷售額(PRV)就會增加。可是不幸的是,我們經常是減少訂購數來提升AOV,這樣就成的就是盈利的假像。一般來說,AOV不是一個非常有用的測試標準。
每位訪客的銷售額(PRV)衡量的是你的網站在把客戶轉為實在的收益的方面的表現。它的計算公式是: 網站總收入/總訪客=每位訪客的銷售額(PRV
重要資訊:要是你使用收入成功標準就必須保證能把訂單的價值從整個電子商務系統裏提出來。如果你用的是第三方購物車,要做到這一點就不太可能。可以和代理你的商品的賣家談一下,如果還是不能,你就需要去升級到一個更便捷的購物車系統。
如果你賣的商品不止一種,你的目標就是最大化每位元訪客的銷售額。這一點基本上是最重要的電子商務測試標準,因為它能夠最大化收益。
隨著測試的進行,你可能會有興趣知道那些很有創意的方法到底起了多大的作用。當然了,我們都希望能看到轉換率的激增,但是不會經常發生這樣的事情。一些應用軟體可以幫助你算出總的增長量,但是你也有可能有興趣自己動手去計算:
增長總是用管理效果來衡量的,也因此一定要在測試中包括管理這一條。
要得出增長,可以使用下面這個公式:
(新的成績-舊的成績) / 舊的成績*100
我們舉一個具體的例子。在一關於登陸頁面的A/B測試裏,轉換率由1.85%提高到2.45%,那增長率是多少呢?
(2.45-1.85) / 1.85 * 100=32.4%“測試雜音”是指任何處於測試者管理之外,會對結果造成影響的東西。許多雜音來自於測試本身進行的環境。雜音會對所有類型的測試產生影響。
在一間實驗裏,幾乎所有東西都處於嚴格控制之下。環境裏的雜音像是溫度、相對濕度等也都考慮在內,並且在整個實驗過程裏都進行了監控。
但是如果這些東西沒有監控,就有可能對測試結果帶來影響,就成了“雜音”。它們引起測試樣本的不可靠性,使所需樣本數量增加,也減少了測試結果的可靠程度。
所以網路銷售商的頭號挑戰就是雜音。行銷本身就是充滿雜音的。在傳統的測試環境裏,很多雜音都可以被發現、監控。但是在網上,不但能被監控的數量很少,還有很多雜音根本就不被人發現。
想一下可能會促進或是阻礙一個行銷計畫的不確定因素:
當然了這個清單很短,還有可能會出現成千上百個別的雜音。自然災害不會每天發生,但是它們會時有發生。可這張清單上的一些雜音卻是時時都在發生的。
幸好,你還能做些什麼去減輕雜音的危害。嚴格遵守測試規則是必須的。繼續往下讀獲得一些抵制雜音的方法。
許多測試新手會有點難以理解雜音的概念。理解這個概念對獲得測試成功來說是非常必要的。讓我們想想看測試結果裏有雜音會是什麼樣:
雜音會造成測試結果不正確。
雜音對結果最大的影響就是可能會使它們不正確。在多變數測試中尤其是這樣。當你開始測試,你的目標是在一個特定的環境下,獲得讓一些方法最優化的可行性資料。
假如得出的結果是錯誤的,你就有可能會為公司帶來虧損。測試結果都會在銀行帳戶裏體現出來。
我們假設你賣一種家用淨化空氣的產品,在冬季銷量很好,因為那時人們大部分時間待在室內。
六月份,你想對一些銷售標題進行測試,這些標題都針對了產品的某一個賣點。終於到了冬季,經過半年的準備你已經非常有信心,可是你期望的銷售量卻始終沒變成現實。
為什麼?
因為你的測試沒有把季節雜音對銷售的影響考慮進去。測試在夏季考慮客戶心中的最大優勢是什麼,而那時人們並不是很關心室內空氣品質。可冬天,人們對空氣品質的關注就上升了。而你的測試針對客戶卻是將大部分在室外度過的人。
你使用的測試方法不同,雜音對測試結果的影響也不同。A/B測試是最有彈性的,因此所受影響也最小。當然這並不是說它們一點也不會受到影響。
大的多變數和部分實施因數測試在有雜音的情況下表現最糟糕。稍後你會看到,這些方法是怎麼樣調查這兩種方法不同的集合的,又是怎麼樣預測出最好的集合。嚴格遵守測試規則,以及仔細設計測試是得到好的結果的必要條件。設計一個有效的多變數測試意味著要處理裏可能出現的雜音,以使測試順利進行。
一個完整的因數測試同典型的分裂測試設計相同。在因數測試裏,任何一種可變因素的組合都會在測試中驗證。這有助於減少雜音的影響。
統計學家用“阻塞”這個詞來形容把雜音從測試中除去,也指“阻塞”它的影響。你永遠可以使用阻塞來減少或是消除網站測試中的雜音。下面是兩類最常見的雜音源,我們還同時加上了減少雜音的措施。
幾乎所有的網路行銷經理都注意到一周裏總會有一天的銷售額比其他幾天高,又總有一天比其他幾天要低。為什麼會這樣?普通顧客的購買心態在一周的每一天裏都有變化,一些人會在週末更想購物,而一些人則是平時工作日更想去買東西。
你從星期一開始測試,到了星期四,你可能就已經得到了一系列的資料,顯示你的銷售狀況很好。經驗不豐富的測試者開始慶祝了。可是到了週末,你會發現你的銷售落到了後面。
怎麼去避免這樣的問題?你的測試一定要進行一個整周。這樣就把週末、周日消費心態不同對測試結果的影響排除了出去。我建議每個測試都至少進行兩周,一周裏的每一天都能觀察兩次。這樣有利於減少其他雜音對結果的影響。
和一周裏的某一天一樣,一年裏也會有一些時間對人們的購物心態有極大的影響。我們不建議你在某一個假期裏開始測試,除非你就是想知道人們的假日購物心態。
記住下列季節影響:
以上的每一種因素都有可能對你造成影響。我們列舉出來以供參考。
為測試設一個時間限制是堵塞季節雜音的最好辦法。除此以外,也可以通過關注市場變化來避免。
潛在轉換是指發生在客戶接受了報價後的行為。
由你的報價決定,潛在轉換可以占總銷售或是總轉換量的很大一部分。這個比例在2—5%到100%之間。
和潛在轉換比例同樣重要的是,從最初報價到轉換形成所用的平均時間也會對你的測試帶來很大影響。這個時間可以告訴你在測試完成多久之後,才能對結果進行整理。
潛在轉換對測試者是一個很大的挑戰。忽略了它們,你的測試結果就漏掉了很重要的一部分資料。
在結果還不成熟時就斷定測試裏誰的效績好只會導致錯誤的決策,在多變數測試裏尤其是這樣。
在你開始一次測試之前,你應該就對潛在因素形式有了一個瞭解。這一點,你可以通過計算報價後數天內的轉換數來決定。
接下來這個例子就很好的解釋了這個問題。我一般看兩樣東西,一個是非潛在轉換,就是報價當天發生的轉換。另一個是潛在轉換,也就是在報價後幾周內有多少人轉換。
就是在結束測試後你也應該持續跟蹤轉換數,這樣有利於收集潛在轉換資料。
| 日期 | 總轉換數 | 總轉換比例 |
|---|---|---|
| 無潛在因素 | 506 | 49.03% |
| 0-6 | 728 | 70.54% |
| 7-13 | 153 | 14.83% |
| 14-20 | 41 | 3.97% |
| 21-27 | 4 | 1.84% |
| 28-34 | 19 | 1.84% |
| 35-41 | 19 | 1.06% |
| 2-48 | 11 | 0.58% |
這個例子來自於一個主頁測試,是為了得出銷售轉換數。有超過50%的顧客在看到報價後轉換,一周後有30%的人轉換。
| 日期 | 總轉換數 | 總轉換比例 |
|---|---|---|
| 無潛在因素 | 3697 | 87.71% |
| 0-6 | 3904 | 92.62% |
| 7-13 | 263 | 6.24% |
| 14-20 | 36 | 0.85% |
| 21-27 | 1 | 0.17% |
這個測試是關於駭客安全標識,以及它在多大程度上能影響顧客的行為。成功的衡量標準是“加進購物車”的動作。轉換發生的很快,讓這個測試很好去分析。但是也要注意:“加進購物車”的動作並不是讓商家最感興趣的。就像你已經瞭解到的,在一個電子商務環境裏,最重要的標準是AOV和RPV。潛在因素考慮的是銷售,而不是“加進購物車”這樣一個舉動。
| 日期 | 總轉換數 | 總轉換比例 |
|---|---|---|
| 無潛在因素 | 639 | 96.38% |
| 0-6 | 646 | 97.44% |
| 7-13 | 7 | 1.05% |
| 14-20 | 8 | 1.21% |
| 21-27 | 1 | 0.3% |
許多人沒有意識到的是就是免費的東西也會帶來一些潛在轉換。這個免費DVD的轉換竟然達到了38%。而且即使是免費的,也還有幾乎4%的人等了至少一天去轉換。
如果你在測試結果裏不考慮進去潛在轉換,測試結果不正確的可能性就會大大增加。
測試中最難以讓人理解的一個原則就是統計真實性。你怎麼知道你的測試要進行多久才能得到真實的資料?什麼時候才能相信測試結果?在測試的各個方面,人們對統計真實性的不理解和疑問要比其他方面都多。
許多人意識到他們需要在統計上非常有價值的結果,但是又不知道它到底指的是什麼。衡量統計顯著性的方法決定著什麼時候結果才可信,也決定了需要多少個樣本。
統計顯著性衡量的是一些結果自我從複的可能性。如果你的頁面顧客轉換率是25%,統計顯著性就用來解釋你有多少可能在明天或是下一周也有25%的轉換率。這種可能性用百分比來表示。但是還會存在一個誤差範圍。你的樣本數量越多,結果的可靠性就越高,誤差範圍就越小。
在一個關於兩個或是更多頁面的測試裏,統計顯著性用來比較兩個或是更多不同版本間的運行差異。可信度指數是用來表示這個更好的版本在將來還能表現最佳的可靠程度。
在統計方面具有重要意義的結果是每一個測試都想達到的目標。我們可能99%的相信一個網站的A版本要比B版本效果更好。這就表示我們的確相信A版本要比B版本效果更好,同時至少在相同的一段時間裏它的表現都要更好。
許多不同的因素都會影響到統計顯著性。大多數都知道的一點就是樣本量。你測試中的樣本量越多,統計的顯著性就越高。之所以很難預料需要多少樣本,是因為它並不是影響結果可信度的唯一因素。
很多人沒想到的是“信號”的長短也會極大程度的影響到統計顯著性。這也就解釋了挑選和設計有效的測試組件是非常重要的了。這一點,我們在第五章“組件設計”中會詳細談到。
最後一個影響因素是環境雜音。雜音會降低結果可靠性。所以你要盡一切可能減少雜音對結果的影響。
| 影響 | 影響增加 | 影響減少 |
| 雜音 | 可信度減少 | 可信度增加 |
| 信號 | 可信度增加 | 可信度減少 |
| 樣本量 | 可信度增加 | 可信度減少 |
我們很難事先預料需要多少樣本,但是我們可以知道怎樣去確定樣本的最低數量。如果你的測試設計有效的減少、控制了雜音,你就能更快得到準確的結果。同樣,如果通過仔細選擇測試元件,測試信號強度得以最大化,你也會很容易的得到顯著的統計結果。
那些看你的測試過程的人被稱為測試樣本。挑選測試樣本對於一個測試的成功是非常重要的。不同的樣本在雜音和潛在因素兩方面都有不同的表現。做為測試人,你的目標是盡可能的使用最有針對性的樣本。一個有針對性的樣本是那些非常有可能接受你的報價的人。
要點:
一個有針對性的樣本可以減少你所需樣本量,提高測試結果的品質。
要得到有針對性的樣本方法之一就是把你的網站訪客分割進行測試。這是指按一些線索將他們分開來,比如說購買歷史、特徵等。這樣進行測試要比所有人放在一起測試的效果好。
那些點擊你的網站的人又分為很多類型。他們可以分成:
在以上所有類別中,只有真正可能會成為客戶的人才是你感興趣的對象。這些人處於購買的不同階段。他們是唯一會對你的市場報價做出回應的人。如果你在測試時也把其他類包括進來,就會增加結果的不可靠性。
PPC流量很自然就可以分開,這部分是最好的測試物件。PPC做為流量的來源之一,它們的優勢在於你在一定程度上能掌握它們。但是它們也限制了你的樣本量。
你可以關鍵字搜索來確定你的樣本。通過確定某一個範圍內的顧客,關鍵字為你找尋測試物件提供了強大的幫助,因為不同的產品範圍,就有不同的關鍵字進行搜索。
當客戶開始找某一類產品目錄時,他們通常會用範圍很廣的詞來搜索。比如說,一個人想安個游泳池。他就可能會用“池子”、“游泳池”這樣的詞來搜索。這樣的客戶可能更會對消費勘查這樣的方式有反應。
當顧客對他們要買的東西有了更清晰一點的概念後,他們通常就會用賣家的店名去搜索。這一類客戶更有可能成為你的目標,他們就是你想最優化網站去服務的物件。
自然搜索結果和PPC結果都為你確定樣本提供了另一個途徑。你在SERPS(搜索引擎結果頁面)的位置會影響到你的對象針對性有多強。許多商家都竭力想在自然搜索上排第一。同樣,在PPC搜索結果名單上占取第一也是許多商家競相想得到的。
事實上,Google估計付費的排名第一的位置要比較低的位置帶來更多的流量,儘管這一點在得到一個好的測試結果方面並不是特別有幫助。還記得我們分類裏的“隨機點擊的人”麼,這些人的出現基本上都來於在最前列的排名,人們總是習慣點擊他們看到的第一個結果。
排名第一也可能會讓你的老闆很開心,但是它最終會在你進行測試時帶來影響。這些“隨機點擊的人”會讓你的測試結果可靠性縮水。因此在你的PPC之戰中,最好還是尋找第一下面的位置。
客戶與你的網站接觸越多,就越會自發分割成一個有針對性的群體。因為隨著在網站的活動深入,就要求有更多的點擊,而每一步點擊都會把那些不怎麼有興趣的客戶分割掉一部分。
要是在你的測試中要分幾步點擊網站,你的測試物件就更有針對性,你也會發現你可以更方便的得到結果。
這被稱為站點活動細分。你應該按照客戶在你的網站的行為的不同來劃分。以站點活動為基礎來劃分可以有以下幾類:
訪問數量:隨著訪問數量的增加,它們應該更有針對性。
訪問關鍵頁:假如他們流覽了一定數量的關鍵頁。
每次訪問時流覽的頁面:如果用戶看了很多網頁,這就說明他們對此很有興趣,就應該被針對起來。
要記住,這一切都是為了得到更有針對性的物件。做為測試者,你的目標是盡可能的使用最有針對性的物件來測試,因為這樣就可以最小化測試樣本,最大化統計真實性。
在你開始一個測試前,你先要確定你要使用的方法。一般來說,主要有兩種方法:A/B分裂實驗和多變數實驗。
即使我的許多在測試方面的同行都這樣說,我依然不認為分裂實驗是測試方法裏的古董。相反,你應該把分裂實驗和多變數實驗看成是兩種不同類型的方法加以使用。
儘管你經常能看到最優化和測試兩個詞交替使用,實際上它們是大不相同的。測試的概念通常是和分裂實驗聯繫在一起的。而最優化則通常是和“多變數最優化”放在一起。
這區別儘管很小,但是很重要。
測試裏一般包含假設、實驗以及對結果的分析。分裂測試比較同一個因數的兩個或是更多的選項。分析也相對得簡單—一個版本好還是不好。
最優化是一種過程,它在許多因數中做出最好的選擇,以最大化產出。一個多變數最優化要考慮很多因數,還要決定出這些因數裏最好的組合是什麼。分析不可能立即就很清晰明瞭。但是實驗可能會得到一個最優化的頁面。
你是用分裂測試還是多變數最優化,你都要比較兩個或是更多個不同的方法。一個方法解釋了一條建頁面的路。使用A/B測試法,方法裏只有一件事可以改變。多變數實驗可以測試多種因數,因此每一個方法裏都有超過一個的因數,而且每個方法都大不相同。
所有要被測試的方法組合在一起就是我說的成套測驗。在一個只有兩個版本的A/B分裂測試裏,成套測驗就由兩個方法組成。一個多變數測試使用裏面有4—36個方法的成套測驗。
測試裏使用的每一個方法都要展示給你的網站訪客看,同時回應資料也要收集起來。
分裂測試是一種很簡單的市場行銷技術,它比較的是廣告、報價、網頁、銷售頁面、以及其他市場行銷資訊的有效性。分裂測試也被稱為A/B測試、多層次測試、或者是OFAT。
在分裂測試裏,每一個銷售資訊的對像都被分為兩個或是更多個分類。結果的真實時間表會及時顯示出哪一個版本的效果更好。在網路上,這就是在一個網頁的不同版本裏劃分流量。
這種方法就對不同資訊進行了比較。測試還能自動消除許多外界雜音對測試結果的影響。
分裂測試在市場這一方面並不新鮮。但是,對網路而言,它還是相當新鮮的。通過直接郵件,傳統的經銷商已經使用多年分裂測試這個方法。
主要有兩種類型:一個是經典的A/B測試,還有就是多層次或是A/B/C+測試。兩者最大的不同是在過程中使用的方法數量不同。在A/B測試裏,主要有兩方面,一個是控制,一個是測試。多層次測試則要超過兩個方面。
幾乎關鍵字廣告在網上一出現,那些精明的商人就意識到了它有多大的作用。直接的市場測試很容易進行,事實上Google似乎也接受了這種做法,鼓勵廣告商對不同的廣告創意進行測試。擁有一小時幾百萬次的搜索,不用花多少時間就能達到足夠的流量以獲得讓人信服的結論。
用關鍵字廣告做為登陸頁面的測試工具也被一些人推崇,這些人總是自以為是的覺得自己懂很多東西。實際上,要是你看看市場行銷類節目,就會發現這個話題經常被討論,並且還伴隨著有多少行為能夠得到在統計上真實、可信的結果的猜測。
當你使用Google在兩個或是更多個登陸頁面上分散流量時,你就在不知覺地減少你的資料真實性。這也就是說,如果你的測試結果很相近,這些結果就不能采信。
基本上是這樣運行的。在一個人點擊你的廣告時Google記下每一次的流覽數。在接下去的十天內,在購買之前,他有可能四天來點擊這個廣告。發生這樣的情況,你可以猜測一下,你的轉換率會發生什麼樣的變化。轉換率會下降。這個最終轉換的人只有25%的轉換率。另外一個人第一次訪問你的網站就購買了東西,可是他是從你的另一個登陸頁面進入的。猜猜會怎麼樣,只有第二個人的轉換率是100%。要是這樣的事情再多發生幾次,你就會想還是另外那一個登陸頁面更好一點。但實際上這真是一個很不好的想法,誰知道實際上是不是這樣。
唯一方法就是立即記下每一次的流覽數。大部分的轉換跟蹤工具都不是很完善,只有記下所有的流覽量來和轉換量做對照。
更麻煩的是,Google沒有辦法顯示出再次訪問的人數。像我們之前討論過的,潛在轉換占測試結果的很大一部分比重。不能把回訪的潛在顧客計算在內,會讓測試結果非常不可信。
多變數測試是使用數學公式和專門的數列在同一時間測試同一頁面或是網站的多種可變因數。測試會告訴你哪些方法是可行的,哪些是不可行的,以及可以最大化回復率的網頁各種元件的最優組合。這就為在同一時間做很多個簡單的實驗創造了淨效應。
為了幫助你理解,我們先回顧一些統計和測試的例子。在科學班裏,我們學了一個叫做科學方法的東西。這個東西告訴我們一次只能更換一樣元件進行測試。只改變一樣元件,測試更換前和更換後的結果,我們就可以得出這個改變的相對影響。如果想通過這種方式來最優化一個網頁,我們就應該一次只對網頁最一個改變。這樣多次重複以後,就能證明測試結果。
我們大多數人都沒有學過的是,在同一時間測試多種組件的高級統計法。這種方法和上面說的那種一次測一種的方法一樣,都很有益處。
使用多變數測試,會有各種各樣的可能性。你可以迅速瞭解一些頁面元件,比如說標題、產品形象、價格等元件,組合在一起最大化銷售量和流量的方式。你也能瞭解到,是不是一個白背景的女孩圖片和一個藍背景的男子圖片就有更好的效果,一個產品介紹的更詳細點是不是比簡單介紹要來的好。
你不僅會明白哪種元件最好,你還會明白哪些元件組合在一起具有最佳效果。在第一個例子裏,你就會發現一個男子配上一個白背景的組合效果最好,這就是你不曾經想到的組合。
儘管多變數測試和多變因數實驗經常被人們交替使用,這兩者之間還是有一些細微的差別。它們都是同一時間關注同一頁面上的不同變化,並且都能告訴你每一個變化的相對影響。但是多變數測試分析的是不同元件的最佳組合,而多變因數實驗則是將每一個因數獨立考慮。
這就是它們的細微差別,這不會給你的測試造成很大影響。但是,因為一個頁面一直是不同因數組合在一起構成的,我還是對它們的最佳組合更感興趣。
在四十到五十年代之間,一位名叫田口的日本科學家和工程師發明了一種提升製造品質的全新方法,他也因此而聞名。這項技術也被稱為“田口過程提升法”。
田口式方法是實驗設計(DOE)的衍生物。通過對實驗結果的精密分析,實驗者可以得出每一個變數的相對影響,和它對整個實驗結果的影響。
使用田口式方法的多變數測試尤其適用於市場溝通的最優化。在多雜音環境下,它要比其他方法更能起作用。同時,在觀察較小的樣本量時,田口式方法也是一個很好的選擇。
一個典型的田口式實驗法要經過下面幾個階段:
這是最開始的實驗階段。這一階段是對不同變數進行一個大概的流覽,然後決定出哪一個變數更有影響,可以為進一步優化所使用。
經過第一階段,這一階段研究的是經證明更重要的變數。經過運算會得出最優的變數組合。但是由於市場雜音,這個組合可能會被證明並不是最佳的。
通過使用一些理論上最優的設計、測試中最好的方法和一些其他的組合,對最優化組合進行微調,並把它們放在分裂測試裏進行逐一測試,從而得出哪一個方法效果最好。
多變數試驗的步驟計畫完整,它並不是隨意的對頁面上的一些元件進行測試。當人們第一次聽到多變數或是多變因數測試,他們會傾向於認為是測試頁面上的元件的任何一個組合。
但實際上並不是這樣。一個多變數實驗的測試有明確的測試步驟,首先是選定一個頁面上的幾個可變因數,然後是為每一個因數設計一套選擇項,我們把這稱為“層次”。
在你開始計畫一項多變數測試時,想一下你具體要測試哪些變數。最好把它們寫下來。然後為每一個元件做一個選擇清單,這些是“後選層”。這些層次又和不同的方法相匹配。測試的設計決定了你需要多少方法,在下一部分會有更多與此相關的資訊。
多變數測試的一個最大優點是它能在相對短的時間內測試很多方法。這樣之所以可能就是因為一種叫做“部分實施因數”排列的東西。這種排列可以測試總的搜索空間的一個子集,得出最好的可變因數和最優的組合。
普通部分實施因數設計
| 組件 | 層次 | 需要的方法 | 實際測試數 | 壓縮比例 |
|---|---|---|---|---|
| 1 | 2 | 2 | 2 | 0% |
| 3 | 2 | 8 | 4 | 50% |
| 11 | 2 | 2048 | 12 | 99.4% |
| 4 | 3 | 81 | 9 | 88.8% |
| 5 | 4 | 1024 | 16 | 98.4% |
| 5 | 2 | 32 | 5 | 84.3% |
| 7 | 6/3 | 4374 | 18 | 99.6% |
一般來說測試的因數越多,壓縮比例就越高,經濟指數就越高。
但是高的壓縮比例也有一個代價,就是資料流程失。在雜音極端多的市場環境下,大型的優化組合不可能很好的進行,除非是在進行過程中雜音降低、對像選擇等方面都給予了最大的注意。較大型的測試需要更多的流量來得出好的結果。
在你開始一項多變數測試前,你要先確定你對第二章“測試條款”中的內容已經有所瞭解。
我建議在你的測試中把分裂測試和多變數測試都包括進去。它們各有優、缺點,也肯定會在有些時候一方比另一方表現更出色。下面這個表對分裂測試和多變數測試裏的兩種:DOE和田口式進行了比較:
| | A/B測試 | DOE多變數測試 | 田口式多變數測試 |
|---|---|---|---|
| 是否使用樣本 | 是 | 否 | 否 |
| 可變因數量 | 1 | 不限制 | 不限制 |
| 每可變因數選擇項 | 2-5 | 2 | 2-5 |
| 所需樣本量 | 適中 | 大量 | 適中-大量 |
| 是否預測可變因數間相互作用 | 是 是 否|||
| 對環境雜音的適應度 | 否 | 否 | 是 |
| 自動找出最優設計 | 否 | 是 | 是 |
| 投入 | 少 | 較多 | 較多 |
| 是否容易操作 | 是 | 否 | 否 |
| 管理認同度 | 高 | 不是完成認同 | 不是完成認同 |
分裂測試可以用來進行快速測試,測試裏的變化也很簡單。因為在測試開始前,不需要過多的準備,所以分裂測試能夠快速的開始。我常常說在一個午餐時間就能想到一新測試,然後回到辦公室幾分鐘後就能進行。
而它最大的缺點是它一次只能檢測一個變化。
毫無疑問,多變數測試最有可能給你帶來充分的結果。它一次就能測試好幾千個甚至數百萬個組合,而用分裂測試可能要做上一輩子。多變數測試還能告訴你頁面上的哪樣東西能給你帶來最好的效果。
而多變數測試最大的優點可能就在於它的運算法則會自動為你決定最佳的頁面設計。
但是要完成一次多變數測試需要時間。因為你是要測試多個可變因數,而每個因數又有多個選擇,所以在測試開始前要有大量的工作需要完成。同時,測試的設計必須非常小心。儘管測試會帶來一個理論上最佳的頁面設計,這不意味著你就可以完全不用思考了。很多時候,最佳的設計也需要進一步的修整。
當你看這本書時,頭腦裏恰好有一兩個測試的想法是最好的。也許是想提高你的主頁,也許是想在你的主站點上增加一個消費勘查頁面。還有很多人希望提高他們的網店的業績。
不同類型的測試都會有一定的難處。本節就會具體看一下不同情況下的各種測試。事實上,這也是本書最有價值的資訊,因為裏面每一條建議都來自於上百個真正進行過的測試。
具體地說,你會學到:
一個登陸頁面就像是你的網站訪客踏上去的地方。它可以是你的主頁,也可以是你的網站上的其他頁面。許多人會從搜索引擎上的一個深度鏈結來到你的網站,我是指連到網站內的頁面上。那麼,你的網站上的任何一頁都有可能成為登陸頁面。
許多人聽到登陸頁面這個詞時,都會認為是專為客戶製作的頁面。這些頁面都應該有專為訪客設計的銷售區域。要想這樣做,就要考慮訪客會從哪里來到你的網站,以及他們是哪一類人。這一切都準備的很好的話,你獲得顧客的機會就會增加,同樣轉換率也會增加。
給顧客他們想要的東西,你就會擁有忠實的主顧。但是要注意的是,不要放上太多的鏈結來分散顧客的注意力,這樣有可能他們還沒讀你的全部內容就轉到別的地方去了。
在你可以確定你的顧客會從哪里來,和你的目標是什麼後,你就可以做一個有針對性的登陸頁面。尤其你是付費得到流量時就更是這樣。
有針對性的登陸頁面可能是網上最容易測試的資訊。因為它們有明確的目標,這就很容易準確地測試是否達到目標。基本上,登陸頁面使用“一條路進、一條路出”的簡單定位方法,這樣顧客就能專注於頁面上的東西。
登陸頁面一般有兩個目的,一個是勘查到消費線索,一個是賣出東西。網路裏到處都有消費勘查頁面。最常見的是用一些免費的資訊換詳細的聯絡資訊。
消費勘查頁面很容易去測試,因為基本上潛在客戶很少,而回復率很高,這樣就不需要很多測試樣本。
直接銷售登陸頁面的目的就是賣出產品或是服務。這種頁面最初是由Corey Rudl在他突破性的網路行銷課程中提出、普及得。直接銷售登陸頁面會用報價、免費禮品這樣的東西來吸引顧客登陸。
由於內容很長,所以它們是對測試者的一個挑戰。你應該注意螢幕上方出現的資訊。
通常一個直接銷售登陸頁面的成功首要因素是標題。除此以外,第一個副標題、第一段、問候語、圖片都很重要。
郵件列表訂閱頁面也是一種登陸頁面,它是為那些並不完全是潛在客戶的訪客來到主銷售頁面前設計得。它也可以被用來去個性化一個報價或是獲取一個消費資訊。它們的好處在與大多數時候,那些看了郵件列表訂閱頁面的訪客的轉換率很高。
郵件列表訂閱頁面會用一些小方法來引出訪客的資訊。通常是郵件地址、姓名,有時也會問其他的東西,
郵件列表訂閱頁面的測試是反直覺式的。一般來說,最優化一個郵件列表訂閱頁面的方法是最大化銷售量,而不是點擊量,這就是說你要去考查真實的銷售轉換量。
常規思維都認為一個登陸頁面應該只有一個轉換路徑。這在多數情況下是適用的。可是如果你的商品有一個較長的銷售過程那該怎麼辦。你的市場策略就應該是在過程中把潛在客戶帶到你的登陸頁面。因此在每一個可能購買的階段你都要有一個可供轉換的選擇。
那些在銷售管道外的潛在客戶可能會很討厭那種滿是註冊資訊的模式,對他們來說,一個簡單選擇性加入形式會更能起作用。而處於中間階段的潛在客戶就會很樂意給出他們的資訊。
有一種方法可以在同一個頁面上處理幾種不同的潛在客戶。
在同一個登陸頁面上把兩種形式都放上。在這裏怎樣計算轉換率是很重要得。你可以把兩種形式的轉換率先分開計算,然後再放在一起,也可以兩者同時計算。
還有一種方法是建一個“兩步”轉換過程。這種方法就是把轉換步驟一個接一個的展示出來。先讓訪客簽一樣東西,再確認,再讓他們看內容。由於過了第一個步驟,人們普遍就沒有了抗拒提供資訊的心理,所以這種方法會收到很好的效果。
當然,現在的問題是哪一個步驟放在第一位。這也是需要測試的東西。
在網路裏,轉換可以在很多階段發生。最經典的例子是付款階段,這需要幾步才能完成。而註冊階段通常也需要幾個步驟。有很多最優化註冊路徑的方法,可以一步一步進行,也可以做為一個整體去優化。
但不論是哪種方法好處都是一樣的。把多個步驟放在一起去提升轉換是從測試中大量得到轉換的秘訣之一。
讓我們看一個簡報。也許用一些簡單的方法和最優化手段就能增加你的報紙訂閱名單。想一下,要是你每個月能得到1000名新訂戶而不是500名,那會是什麼樣。這樣想實際嗎?絕對很實際。通過精心設計的測試和對報紙訂閱形式的最優化設計,幾乎每個人都能達到這個目標。
要怎麼樣面對那些電子雜誌訂戶,這由你自己決定。但是很多人會用電子雜誌去建立自己的品牌,並且去推銷產品和服務。可以在上面放上一個報價,這會讓很多人去你的登陸頁。再對此進行測試和最優化,你的點擊率會由12%升至16%。這些都是很可能的。
一旦這些人去了你的網站,他們會點擊登陸頁面,事情在這裏開始變得有趣起來,因為你就是這裏盈利得。最優化一個登陸頁面可以讓轉換率增長2%至3%。
電子商務網站利用測試和最優化做為一種有力的競爭方式已經有一段時間了。通過在促銷、降價等方面進行大型的測試,許多網店都大幅度地提高了收入。
網路商店是一系列獨特的挑戰。那種直接銷售回復登陸頁面已經過時了。可用性扮演了更重要的角色,你所要看的成功的指標已經不僅僅是轉換率一種了。歸根結底,利潤才是最重要的東西。
儘管有一些共同要被測試和最優化的要素,網路商店不同部分都代表著不同的挑戰。共同測試影響著網站的大部分頁面:
目錄頁面幫助顧客確定他們想買的東西。一個目錄頁面展示的是所提供的商品,通常這些商品都有一定的相同點。目錄頁面很重要,它可以是某類商品的登陸頁面,也是購買時起引導作用。
一個目錄頁面裏要測試的有:
這個頁面的作用是就某一樣商品提供具體的資訊,同時也可以促進銷售。在一些情況下,商品頁面也可以做登陸頁面。搜索產品名稱的用戶通常都是由這裏進入網站的。
除了大型的電子商務測試,你也可以就商品頁面進行測試,並且能在上面採取一些可以確保你的銷售底數的措施。
在一個商品頁面上有很多可測試的東西,但是首先要測試的是:
主頁會對你的網站銷售產生最大的影響,它幾乎是所有新客戶最想去測試的地方。那麼你也應該從這裏開始測試麼?這是我最經常遇到的問題,這一點要由很多因素來決定。
就像是沙灘上的一條線,電子商務商人好象也是分成兩塊,各站一邊。在主頁是否是最適合去測試這個問題上,我肯定有我自己的看法。但是我寫這篇小文章是為了能讓你自己做出決斷。事實就是,這個問題的答案取決於你的網站、報價和其他因素。
有一點是確定的:99%的網站裏,主頁都是最難測試的。
為主頁測試找理由是個不錯的辦法
一段時間的流量非常多變。也許這個月表現很好,到了下個月就有可能很糟糕。主要的搜索引擎通常是以月為基礎來改變搜索索引。你今天得到的流量可能會和你明天得到的流量完全不同,因為用來找到你的關鍵字變了。
現有的關鍵字使用者可能會對方案A反應良好,你的測試會告訴你A是最好的方案。可是Google一旦改變搜索索引,你的網站所有流量就有可能突然轉到你的競爭對手那裏。而你的測試不會想到這些,即使你的測試結果非常準確,當搜索索引變了以後,可能你的新用戶反而對B反應更好了。當然,也有可能在下一個月這種情況又變了回來。但是這仍然會讓人難以對主頁做出判斷。
不只是潛在客戶點擊你的主頁。這是主頁測試人面臨的最大問題。想一下登陸你的主頁的人可能會有哪些:你的競爭對手、找工作的人、來找你的電話號碼和更多相關資訊的你的現有客戶。然而以上還只是個開始。
這個我們稱之為隨機雜音因素。它沒有辦法去預測,可能一段時間雜音很多,又可能一段時間裏幾乎沒有。它的基本影響是會讓測試結果不完全真實,也不容易得到測試結果。
即使你得到了傳統意義上的真實統計資料,這個雜音還是會讓你難以相信結果。
難以確定目標。大多數主頁上面體現著客戶的各種目標,可能是訂閱報紙,可能是下載白皮書,也有可能是簽銷售合同。這就出現了一個問題。如果你想最優化白皮書下載,卻要以銷售為代價,那怎麼辦?你怎麼樣去衡量轉換?
你所做的任何變化都有可能影響你的搜索引擎排名。使用一款高性能的測試軟體,就能避免在測試階段影響到搜索引擎排名。但是當你想對內容、圖像和版面做出改變時,影響就又會出現。因為主頁對搜索來說是最重要的東西,所以改變是會很有風險的。
就像你看到的,在測試和最優化主頁時有很多的考慮。我們建議你開始測試時,首先在網站內一個針對性較強的頁面進行。這會幫你得到更多的線索。一旦你開始明白網路測試的一些困難,就可以考慮去進行主頁測試了。
加盟頁面的測試也很困難,因為缺少大的加盟網提供的資料。從商品站點得到cookie的人每購買一次,加盟提供商就會得到相應的報酬。這些人的目的就是預售商品,引導盡可能多的人去銷售商那裏,他們就能從中得到cookie。在購買時,他們又提供保證,然後從中獲得傭金。
加盟提供商的一個目標就是盡可能的為銷售商帶來點擊量。這一點跟蹤頁面可以幫助去測試和優化。
我們設計了一個測試,測試的目標是通過加盟鏈結最大化點擊率。除了定位網站的鏈結以外,頁面上的每個鏈結就是加盟鏈結。
你可以測試:
把網頁或是網站分成一個個供測試的元件,對很多市場商人來都難以理解。
總結元件設計的最好部分是把網頁看是一個資訊、圖像或是文本的收集器。元件是構成網頁或是網站的基本元素。它們是頁面能看地見的磚,比如說按鈕、圖像、文本,價格。
做為測試者,你的目標就是把所有元件結合起來,使它們能充分發揮效能,達到期望值。當你做到這些,你的頁面就有可能表現出最高水準。
| 正確組件的例子 | 錯誤元件 |
|---|---|
| 標題 | 號召(包括了很多組件) |
| 圖像 | 設計(包括了很多組件) |
| 第一段話 | 色彩方案(改變很多東西) |
| 補充說明 |
大多數在開始測試時,都會選擇運行的主頁的多個不同版本,而這樣做最終會讓測試的效果微忽其微。原因很簡單,因為這樣做破壞了網站最優化的一個基本原則:在同一時間內改變多樣事物。
你在網頁上做的每一個改變都會對結果產生影響。有些影響是正面的,有些是負面的。如果一次做很改變,就很可能那些正面影響被負面影響抵消,最終結果無一所獲。
測試元件要嚴格遵守的一個原則就是把你的測試頁面分成幾個元件。不管你是用多變數測試還是A/B測試,目標都是一樣的。一次只注意某個特定的元件,可以確保結果的正確性,也不會因為同時測幾個元件,而使結果相抵消。
在書的簡介中,我說了一種叫做GIGO的原則。它是一個縮寫,代表的是“進去垃圾、出來垃圾”。要是你在測試里加進了垃圾組件,你就會得到垃圾結果。也許有可能結果會好一點,但是通常是更糟糕。
進行有效測試的秘訣不是你使用的方法,而是你測試的頁面元件。用心去選擇和設計最高效的元件,你會得到非常好的結果。
組件實際上就分為兩類:主要的和用做修飾的。主構件是網頁的基本元素,包括像是標題、副標題、標識、等等。它們是一個網頁上最先讓人注意的東西。
修飾元件則是用來修飾網頁的元件,比如說字體大小、顏色、樣式。它們修飾現存的組件。
| 主構件 | 修飾組件 |
|---|---|
| 標題 | 字體大小、顏色、樣式、字間距 |
| 圖像 | 圖像大小 |
| 命令按鈕 | 命令按鈕的大小、內容、顏色 |
什麼時候把頁面分成一個個基本的元件,這是最常見的問題。一個商人可能會去測試標題,並把標題做為元件。於是不只是標題的內容可能不同,甚至顏色也會有很多種。這樣做是不對的,因為實際上是同時有兩個因數在被測試。
的確,你可能會得到一個標題很有用這樣的結論,但是這個標題之所以有用是因為內容還是因為顏色,還二者共同起作用的結果?測試的結果交雜在一起,所以你永遠都得不到答案。
把修飾元件放在一起測試會要求你把標題內容做為一個元件來測試,而標題的顏色做為另一個來測試。通過這種方法,兩者的效果都能看到。
在任何一個頁面上,都會有一些元件影響力很大,而另一些組件則起不了多大作用。正確選擇元件需要花費一定的時間,但是一段時間以後,你會注意到對你的結果產生最大影響的都是同一個頁面部分,也都是同一類型的元件。
為了最大化測試的反應,你所選擇的組件應該相互配合。換 句話說就是,這些元件應該支援於同一個目標,協同工作支援那個目標。
要選出真正有影響的元件,最好的辦法就是去測試。在下面的分裂測試裏,即使用了相當多的流量,依然沒有顯示出來哪一個元件最好。
多變數測試就最有影響的元件進行科學測試,為進一步的測試提供了有力的資訊。一個最好的方法就是用多變數測試來選出最重要的組件,再用分裂測試對這些組件做進一步加工。
最有影響的元件一般都在頁面上部,比如說標題、副標題、問候語等。這些能幫訪客確定他們是否要繼續看頁面內容。其他熱門的地方包括頁面閱讀最頻繁的部分,比如說圖片說明、留言板。
由於功能不同,元件可以分成不同的類型。在本節,你會對一些基本元件有所瞭解,會知道它們對於測試的重要性。
注意:事實上一些元件不只完成一種功能。就拿標題來說,它既能用來抓住別人的注意力,同時又能降低風險。
在本節裏,我們會給這些組件都舉一些例子,好讓你瞭解你為什麼要去測試它們,並且怎麼樣才能達到最大的效果。
網頁上的注意力掠奪者可以幫助潛在顧客決定他們是不是要接著看下去。注意力掠奪者要能夠迅速向用戶傳遞“他們能從中得到什麼”這樣的資訊。
重複的測試告訴我們通常“注意力掠奪者”這類組件在網頁轉換上起的作用最大。“注意力掠奪者”可以用來提高網站的註冊率。如果你都不能抓住用戶的注意力,讓他們看完足夠的資訊,你怎麼還能去期待他們轉換呢。
用五秒鐘看看你的頁面,你會發現什麼。再離你的顯示器十或十五英尺遠,你又能發現什麼。可能這些就是你應該注意的東西。
不論是不是在網上,每次交易都會伴有一定的風險。但是網路上的風險要更容易注意到。為了對抗這些風險,行銷商們採取了一系列的措施,比如說擔保、鑒定書或是權威標誌。使用這些風險轉移元素可以有效提高回復率,是一件非常有用的東西。
有人建議在頁面上盡可能多的加上風險轉移元素。但是太多的風險轉移元素又有可能分散人們的注意力。那就用測試來決定風險轉移元素的數量、類型和位置。
下面是一些基本的需要測試的風險轉移元素
供應和需求”的經濟法則解釋到如果供應減少,需求就會增多。在銷售方面,這一點也適用。
網上最有效果的報價都會製造出一種稀缺感,再在裏面加上一點很緊急的意味就更能增加報價的力度。在網上,我們到處能看到這樣的例子。
有很多可以通過稀缺性創造需求的方法。最常見的方法總結在下面。
網頁上的促銷元素是為了使某一方面,通常是銷售量增加。兩個最常見的銷售促動資訊是“免運費”和“免稅”。
當然,不是所有的商家都敢用“免稅”來招纜生意的。但是如果你這樣做,你就有了相當大的競爭力,尤其當你賣的東西很貴時更是這樣。
基本促銷資訊:
測試促銷資訊的關鍵在於確定它們都是以能獲得利潤為基礎得。免費或是低價可以增加你的轉換量,但是代價是利潤。用每位元客戶帶來的利潤做為尺度可以幫你確定促銷是否真得對你的生意有利。
這一點上,我們主要觀注的是組件的選擇。想得到好的測試結果或是管理好樣本量都需要注意元件的選擇。
設計好的元件需要時間和經歷。關於組件設計有三條黃金法則:
人們想知道網站能為他們帶來什麼。如果標題沒有明確顯示出他們會感興趣的東西,或是表達方式不對,都會讓你損失顧客和金錢。相反,要是加進“你”這個字眼,對標題和整個廣告就都是一個突破。這一點我們在很多測試裏都看到過。
在內容里加上數位會看起來更可信。不要說“我們的系統有很多優點”,應該說“我們的系統有97項優點,它每星期至少能為你節約九個小時的時間”。
有一些詞非常有作用。因為它們使用“怎麼樣做”來給標題開頭。網路上的人都在尋找資訊。換句話說,“怎麼樣做”就是在暗示能提供某種資訊。
語意分類指的是不同組件選擇在意義上的區分。在設計元件選擇時進行高度語意分類可以帶來結果上的革命,並且能減少樣本量。也就是說,你必須設計在語意上區分很大的選項。
解釋語意分類的最好方法是用一些具體標題的例子。
一個好的分類的例子:
版本A:
怎麼在人人都會做的六個簡單步驟裏賺到更多的錢?
版本B:
在你現在的雇主身上找到隱藏起來的付出。
這兩個標題可以用在同一樣商品上。但是它們卻完全不同,用詞不同,對客戶產生的影響也不同,因此它們帶來的回復率也不一樣。
一個差的分類的例子:
版本A:
怎麼在人人都會做的六個簡單步驟裏賺到更多的錢?
版本B:
怎麼在人人都會做的六個簡單步驟裏賺到更多更多的錢?
這兩個標題太相似了,它們產生的結果可能都會一樣,即使有少量的差別,也會被測試裏的雜音掩蓋。
一個色彩分類的例子
好的分類:
版本A:紅色
版本B:藍色
不好的分類:
版本A:紅色
版本B:紫紅色
同樣的,第二組的分類過於近似,不會給結果起到什麼作用。
在各種元件間進行有效的語意分類能夠幫助你更快的得到測試結果。測試區分度很大的選項更讓你有可能得到完全不同的結果,而且有可能是更好的結果。
像我們此前討論過的,多變數測試是一個較短的時間內把測試資料進行壓縮,從而得到一個更有可能性的組合。壓縮資料意味著用大量的語意分類來設計組件是非常必要的。通過這種方式你能夠更快地得到具有可信度的結論。
我用“結果革命”這個詞來描述真實的測試結果從雜音中突顯出來的能力。如果你提高語意分類和對影響結果的雜音的控制度,“結果革命”會相應提升。如果你忽略了這兩者,“結果革命”會相應降低,你也就不可能得到出色的測試結果。
在測試方法那一節裏你已經瞭解到,每一個測試都是由兩個或是以上的測試頁面組成。我把這些頁面統稱為“測試組”。軟體商想出了很多製作、展示這些頁面的方法。
用這種方法,你可以為每一種方法都做一個測試完成頁面,然後分別跟蹤和測量每一種方法。這種方法最大的問題是你有可能要在搜索引擎裏因複製內容受處罰。
這種方法要使用javascript或是DHTML來替代內容,這樣做的好處是不用改變被測試網頁的URL。通常SEO(搜索引擎優化)不會受影響,因為搜索引擎不能處理用來安放測試因數的javascript。
每次下載一個頁面,伺服器就會提供一個完全不同的HTML。這就能讓URL保持一致,也避免了複製內容的爭端。但是過於頻繁的改變HTML源會造成自然搜索排名的起伏。
線上測試和在貨棧和實驗室裏的測試不同。網頁會給測試帶各種截然不同的挑戰,要想測試成功,就必須克服這些挑戰。
我們已經說過了,有一些軟體已經能達到這些要求。在你評估軟體時,考慮到下面幾點:
測試軟體主要有兩種工作方式,一種是做為一個包裹安裝到伺服器上,還有一種是做為訂閱服務在主伺服器上運行。兩種方法都各有優缺點。如何選擇就取決於你的網路運行能力、資料敏感度和對搜索排名的依賴程度。
贊成的理由:
反對的理由:
這一類的應用軟體有:Offermatica, Vertster
贊成的理由:
反對的理由:
這一類的應用軟體有:kaizentrack , split test accelerator
把你100%的流量都進行測試不是一個聰明的做法,除非是你的流量太少,所以你必須把它們都包括進去。如果一些被測試的變數表現要比控制中的差那怎麼辦?你可能不能承受在進行測試的兩周內都虧損。
就是在一個多變數測試,測試組的平均表現也有可能比控制中的差。
由於這些原因,我建議流量中的5-10%進行測試,這樣能有效的減少對收入的影響。
許多公司都依靠搜索引擎排名在網上取得成功。排在首位能帶來大量有品質的流量。如果你也依靠這樣的流量,你就要小心評估軟體對搜索排名的影響。
一些測試軟體利用伺服器來顯示頁面的不同。這又會導致不斷的向資訊採集軟體更換圖片,最終給排名帶來極大的影響。
另外一些測試軟體則會使用完全不同的URL,這有可能會引起內容複製和其他的SEO問題。
還有一些測試軟體使用javascript或是其他的辦法。這些方法都讓搜索資訊採集軟體看不到測試軟體的存在。
一直以來,網路追綜都是由第三方cookie進行的。但是近幾年以來,出與個人隱私的考慮,第三方cookie受到了越來越多的指責。
考慮一下你自己系統內使用的追綜cookie,這些cookie的所有者可以跟蹤並記錄下你訪問了哪些網站,你的每一個舉動都會被記錄並永久存儲下來。這聽起來的確很恐怖。
現在網路隱私軟體發起了針對第三方cookie的戰鬥,這一點毫不奇怪。評價一個軟體要根據它們在跟蹤測試結果時使用的是哪種cookie。
一些用戶鎖定了第三方cookie,還有一些在常規的基礎上刪除它們。如果你的軟體依賴第三方cookie,測試結果裏就要加入大量的雜音。另外,你還有可能丟失所有潛在轉換方面的跟蹤資訊。
結果會怎麼樣?那一定會非常糟糕。
當一個飆網的人第一次進入你的測試,他會看到一個具體的方法。如果是A/B測試,他們有可能既看看A版本,又看看B版本。如果是一個大型的多變數測試,他們有可能會看眾多方法中的一個。
用戶再次來到你的網站,方法記憶能確保他們看到的是他們之前看到的版本。這一點在你做一個改變價格和打折率的測試尤其重要。你想一下,要是你每一次看到這個網站,它的價格都不同,時高時低,那會是什麼樣的狀況。不能顯示相同的版本會給你的測試結果帶來大量的雜音。
大多數系統都做到了這一點,通常是將cookie和IP位址識別結合在一起使用。
最知名的多變數最優化軟體賣家:
其他賣家:
更多地瞭解一些關於登陸頁面設計的內容:
關於登陸頁面設計最好的資源是由MarketingSherpa製作的“登陸頁面手冊”。297美元每本的價格雖然不便宜,可是卻很合理。它是登陸頁面設計的聖經。如果你對從何處開始測試沒有一個很好的把握,我推薦你按照書中的建議來做,並且從這裏開始
http://http://www.conversionlab.com/partners/sherpa/
更多地瞭解一些關於分裂測試和多變數測試的內容:
這是由MarketingExperiments.com的專家設計的教程,裏面有關於測試方法的很有用的資訊。也許最好的一點是你能得到一個證明書,你可以把它放在網站上,能暗示你對網站做過測試。
http://www.conversionlab.com/partners/mec/
這是由田口式實驗法專家大衛得.布洛克制作的DVD,是唯一一個關於用田口式實驗法進行多變數測試的教程。我們極力推薦使用。
http://www.conversionlab.com/partners/mec/
如何用這個網站賺每月近6位數的收入
你的博客職業生涯
個人軟體發展
免費網上資源
出口商的網站規格
使用Adsense獲利的秘密
52項網上拍賣技巧
如何從 Web 2.0 獲利
分裂測試優化電子商務業務
如何賺到網路上的第一筆1000美元
網絡風雲:雲運算
如何開發創造力, 如何做到有創造性
112個博客外掛工
怎樣在高排名的網頁中用Flash
怎樣才能讓flash在搜索引擎中獲得索引
製造高點擊率內容和郵件的templates
採訪市場顧問Alex Mandossian
大量免費電子書下載
Web2.0的主人:N世代
如何使用Twitter和微博賺錢
成功案例 01 02
網上賺錢實例
博客和網站免費推廣平台
企業創辦人介紹