与 MBTI 、SBTI不同的是,我重新拆了一套恋爱里的分型系统
链接在这里:lovepersona.fun
01
SBTI 爆火那阵,我盯着那些截图看了很久。
卧槽,大家为什么这么愿意把一个测试结果发出去?
后来我想明白了一件事——
它火的一部分可能是题目,也可能是科学性。
更重要的是它给了人一个很轻的开口方式。
"我挺别扭的""我很需要安全感""我嘴上不说但我很在意"——
这些话平时说出来会很尴尬。
但如果一个测试替你说,还说得有点准、有点好笑、也有点玩梗的意味在,那就能很自然地截图发出去。
一张图就够了。不用解释太多。
我喜欢这种东西。不是因为它多权威,是因为它确实让人蛮轻松的。
那段时间我手上刚好有两个工具——你们所熟知的小龙虾 以及不熟悉的 Codex。
他们两个我是协同使用的:不在家的时候让小龙虾帮我操作,方便的时候更多是用codex,两者协同帮我拆结构拆想法,真的把想法落成页面和代码。
第一反应很直接:能不能先把 SBTI 的页面结构扒一遍,看看它怎么让人想玩的?然后直接抄。
但真开始看,我很快有了一个不舒服的感觉。
照着做出来完全可以,但会没有一个属于自己的灵魂。
02
"没有灵魂",只有不是自己的东西就会没有灵魂。
结构对,页面能跑,标题能写——但它不是你的。
只是一个跟在别人后面的影子。
所以我突然就想到了一个问题:
有没有一套东西,是专门拆人在恋爱里的状态的?
因为人恋爱里的样子,真的经常和平时不是一回事。
平时很理性,恋爱里开始脑补。
平时很会说话,一到亲密关系里变成谜语人。
平时说自己很独立,但真进入到关系,简直和舔狗一样。(哈哈哈 开个玩笑)
普通人格测试拆的是性格底色。
但恋爱关系里,我更想拆的是反应模式。
你靠近一个人时,是推进还是观察?
有情绪时,是直说还是让对方猜?
关系一不稳,是先稳住局面,还是自己先崩不住了?
想到这里,这个 project 才开始有自己的方向。
不再做一个人格测试,是做一套恋爱人格。
是给人在亲密关系里的默认反应,起码起一个有画面感的名字。

03
真正开始做之前,我先把问题压小。
"你适不适合恋爱"——太大,太像算命。
"你是什么样的人"——已经有太多人做了。
我只想测一件事:
你恋爱里的默认设置是什么?
问题一变小,产品结构就清楚了。
最后定成 32 道题,每题 3 个选项,每个选项影响一组关系特质——稳定程度、甜度、表达欲、联系需求、浪漫感、控制感、推进速度、敏感度、内耗程度、边界感。
这些特质压成 4 条恋爱主轴,最后落到 22 种恋爱人格。
中间这个层很重要。
不能只是"你选 A 所以你是某某人格"——那只是贴标签。
我想要先看你在关系里怎么反应,再判断你更接近哪种类型。
这也是我后来一直在调算法的原因。
04
工具这块,说实话,没有想象中顺。
OpenClaw 我用得比较早。
它有记忆,懂我,我不用每次重新交代背景,它大概知道我在做什么、想要什么风格。
内容生成这块它帮了我很多——人格怎么分组,结果文案怎么写,哪里不像人话,它都能给出很具体的方向。
但也不是没代价。
调教成本挺高的,各种报错要修,token 也烧得挺快。
一开始我想让它帮我把网站也做出来,弄着弄着卡住了,有点弄不下去。
后来改用了 Codex 来搭建。
Codex 更像一个真的进项目干活的人——看文件、改网页、调样式、处理图片路径、跑本地预览,说改哪里就改哪里,不废话。
最终分工就变成了这样:
OpenClaw 负责内容,Codex 负责搭建。
这样是我认为比较舒服的一种方式。
但是图像这块又是另一套——22 个恋爱人格都需要有自己的形象。
那段时间 GPT 的 image 2 还没出来,我就用了豆包和 Nano Banana,按照我的想法一个一个生成的。
说起来工具用了不少,但没有一个是顺滑的。
就目前而言,AI只是工具,他们都有各自擅长的地方,但也都有让你抓狂的时刻。
真正的问题从来不是"哪个工具最好用,而是使用它的人"。
是你得知道每一步要什么,然后找最合适的工具去做那一步。
你的判断、独特的idea是任何人都偷不走的东西。
AI只不过是能让你的想法变成现实。
05
这个项目里最有产品感的一次,不是首页做出来的时候。
是算法翻车的时候。
第一版算法很直觉:用户特质分数和 22 个人格画像做距离匹配,谁最像给谁。
听起来合理。我用了几次发现怎么老是出现崩盘救星?
然后用codex帮我随机回测一万次,发现一个很离谱的现象:
ANCHOR 崩盘救星 出现概率将近88%。
原因是:他是偏稳定,而且排序为第一,优先级为第一,概率为 45%。
瞬间无语住了。
但是也知道了问题:算法结构
早期分数做了下限保护,很多"不太像任何人格"的结果被压到相近区间,排在前面、画像又比较中性的类型就更容易胜出。
ANCHOR 崩盘救星 被吸成了一个大坑。
这件事让我意识到:
产品测试是必选项。
没有分布校验,你根本不知道自己做出来的是不是一个看起来很丰富、实际只有一个出口的系统。
06
后来把分型逻辑重做了一遍。
先算 4 条恋爱主轴:
高频在线,还是需要空间。
开麦直给,还是低信号难读。
快进确认,还是慢热观察。
稳住局面,还是容易被情绪带走。
再看强特征规则——
强仪式感、强情绪感 → MOTIF 浪漫质检员
高控制、高推进、低甜度 → TALON 对抗路选手
稳定、慢热、不太脑补 → MAPLE 后劲收割者
低控制、要空间、随缘 → BREEZE 随便谈恋爱
最后四轴组合兜底映射。
改完之后,ANCHOR 崩盘救星 的异常概率拉回到大约 5%。

但新问题又来了:STAMP 边界警察 和 TALON 对抗路选手 偏高,VELVET 中央空调、BREEZE 随便谈恋爱、MAPLE 后劲收割者 偏低。
又做了一轮阈值微调。
没有重写 32 道题。只是收窄某些人格的兜底范围,放宽另一些人格的触发条件。
最终 10 万次随机回测,最高的人格大约 9%,最低的大约 1% 多。
不是强行平均——是恋爱人格本来就应该有高频和低频。
我只是不想让一个人格把所有结果吃掉。
这一步之后,这个网站才从"一个会跑的网页",变成了"一个有自己系统的小产品"。算法这东西,确实有点说法。
07
现在这个网站测的东西很简单。
不测你是不是好恋人,也不测你适合和谁在一起。
测的是:你在恋爱里的默认反应模式。
32 道题,10 个关系特质,4 条恋爱主轴,22 种恋爱人格。
结果页有人格海报、同型浓度、人格解读、四轴百分比、关系侧写和分享按钮。
我特意把百分比叫"同型浓度",不叫"匹配度"。
不想让它变成一种判决。
它不是在说"你就是这个人",更像是在说:你现在的答题结果,有多接近这个人格的典型画像。
区别很小,但我挺在意。
一个测试可以有判断,但不能装成真理。
08
现在比较喜欢的几个结果:
FOG 谜语人
核心不是不爱,是不透明。情绪和想法经常留一半,别人想靠近,靠近久了也会累。
SPARK 热恋快消品
来电快,上头快,氛围起得快。但要分清楚,化学反应不等于长期关系。VELVET 中央空调
温柔、细腻、会照顾人。问题也在这里:不是每个人都该被照顾到这个程度。
ANCHOR 崩盘救星
关系里的稳定底盘。别人和你在一起踏实,但你也容易把"我能扛"用成"我不需要被照顾"。
这些名字希望能够让你们好记一点,追求一眼有画面。
结果名如果不能让人想截图、想发给朋友、想说"这有点像我",它在这个产品里就不成立。
09
写到这里,我觉得这次真正练到的不是"会不会用 AI 做网页"。
会用工具当然重要。
但更重要的是:能不能把一个热点观察,重新拆成自己的产品系统。
方法其实很简单:
看到一个火的东西,不止问"我能不能复刻"。
而是先问:它为什么会被分享?解决的是表达问题、娱乐问题,还是身份问题?
我照着做,哪里会没有灵魂?
有没有一个更适合我的场景,可以重新定义一遍?
想清楚之后再让 AI 介入——OpenClaw 帮我拆内容,Codex 帮我落代码。
但真正要做的判断,还是得由人来做。
不要把 AI 当成替你创作的机器。
把它当成两只手——一只帮你拆,一只帮你做。
中间那个决定方向的人,不能消失。
10
接下来我想验证的事很小。
我想知道:
有没有人愿意点开?有没有人愿意做完?有没有人愿意截图发给朋友?
如果有,就继续迭代。
如果没有,说明入口、题目、结果页至少有一个地方不成立——这比坐在电脑前想商业模式有用多了。
链接在这里,可以打开玩一下:
lovepersona.fun
测完之后做一件事:
欢迎回来留言,告诉我你是哪种恋爱人格。
我现在挺好奇的,最后到底是谜语人多还是中央空调多。哈哈哈
测得准的话点个赞,测得不准的话直接评论区骂,最好顺手告诉我哪里不准。
身边有"一谈恋爱就像换了个人"的朋友,可以把这篇发给 TA。
想看看这个小东西,能不能从我电脑里跑到真实的人际关系里去。

最后的最后,希望这个东西你们能喜欢。