作者: 李柏南 Po-Nan Li

不知道大家是不是也跟我一樣,最近突然非常期待午夜的到來?因為午夜一到就有新的 Wordle題目可以玩了!可是每天只能玩一場,實在有點不過癮,所以我也嘗試玩了 Primel,但是三分鐘就放棄了。最後找到了 Absurdle,總算讓我靜靜地玩了一個下午。藉由 Absurdle 作者 qntm 的介紹,我也意外瞭解到 Wordle 的出題機制。簡單來說 Wordle 每天的題目是作者預先產生好之後按照順序寫死在遊戲本身的 javascript 裡面的,但是除了 2315 個題目單字(可以玩六年多!)外,作者也另外列了 10657 個字作為字典,藉此判定玩家輸入的是不是合法的英文單字。

先撇開題庫不談,大家基於對英文字的了解與認識,或多或少都有一些自己的開題以及解題策略。最常見而且也合理的假設就是五個字母中,必定至少有一個英文的母音字母,也就是 AEIOU。在這樣的脈絡下,許多人就有了基於先把母音猜出來的策略。例如有人喜歡 ABOUT,有人喜歡 ALIEN,也有人喜歡 AUDIO。這些起手式的共通點就是一次就涵蓋很多母音。開局了之後,有人重視利用台面已有的資訊(exploit),也就是只用已經揭露的資訊搜尋,但也有人喜歡探索未知(explore),避開已經知道的字母,反而繼續多掃射一些字母。此外也有看到一些有趣的討論,例如第一個字母是不是最常是 S,又最後一個字是不是很常是 Y?同樣都是母音, AEIOU 出現的機率也不大相同,例如一般相信 E 是最常出現的字母(常用於密碼學),U 則可能是相對少用到的母音。

我很想知道到底哪些猜想是有所本的,哪些則否。於是就做了這張圖:

Wordle letter frequency

簡單來說,從第一到第五個字,出現機率最高的分別是: SAAEE。他們在各自位置出現的機率分別是:15.8%、13.1%、13.3%、13.7%、18.3%,都遠遠超過瞎猜的背景值(3.8%)。此外各個位置也有一些絕對不會出現的字母,例如第一個字絕對不會是 X,第四個字絕對不會是 Q,第五個字絕對不會是 J 或 Q 或 V。

上面那張圖可能有點難閱讀,所以我又做了這個好讀版的:

Wordle Cheat Sheet

這張圖或許可以當作一張小抄(Cheat sheet)來用,無論是開局時或者開局後卡住,又或者是快要收官的但是候選字太多,都可以拿來參考一下每個位置有哪些候選字是比較有可能的。如上面所說的,第一個到第五個位置分別可以猜 SAAEE 最容易中,其次可以猜上圖中比較不透明的字母。

當然作為開局的起手式,實際上並沒有 SAAEE 這個單字,何況這樣只有涵蓋到三個字母也不划算。那到底哪個字最容易涵蓋到各個位置機率最高的字呢?假設 SAAEE 這個價值五分(因為各位置都拿到最高分)的話,那實際存在在「答案庫」裡面的字之中,最高分的是價值 4.1 分的 SLATE,其次還有 SAINT、SAUCE、SOOTY、SLICE 也都非常高分。是的你沒有看錯,全部都是 S 開頭的單字,所以這些字可能都可以當作不錯的起手式,因為不但很有可能答案真的是 S 開頭,而且用這些字也可以掃射到不少各個位置的高頻字母。

有機會再來聊聊開局之後,基於上面討論的字母出現機率,有沒有什麼簡單的策略可以應用。