V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  SlipStupig  ›  全部回复第 16 页 / 共 90 页
回复总数  1790
1 ... 12  13  14  15  16  17  18  19  20  21 ... 90  
2019 年 5 月 26 日
回复了 SlipStupig 创建的主题 情感问题 谈恋爱之脑筋急转弯,求大家来解答
@yangzhezjgs 那就没戏了?
2019 年 5 月 26 日
回复了 Sunflower22 创建的主题 情感问题 处对象吗?
你倒是留个联系方式啊, 不然怎么找你呢。。
2019 年 5 月 19 日
回复了 wesall100200 创建的主题 职场话题 如何劝同事换一台笔记本来上班?
v 站跟同事的矛盾越来越大:

- 同事居然在公司吃饭,怎么劝他放弃
- 同事自带电脑,怎么劝他放弃

未来可以预见更多这种事情:
- 同事居然穿平如的衣服,如何劝他放弃
- 同事长得很胖,如何劝他离职
- 同事没有女朋友,如何劝他善良
.....


然后 V 站标准回复就是:
如果不能改变同事,你就离职,这种帖子越看越无聊
2019 年 5 月 6 日
回复了 flighter 创建的主题 程序员 grpc 的 server 端如何实现代码的热更新?
ingress 了解一下
2019 年 5 月 6 日
回复了 showecho 创建的主题 English 有没有过来人说说英语学习方法?
参加国外的一些峰会,尝试自己投一些 topic 并尝试去演讲
2019 年 5 月 6 日
回复了 ginyan 创建的主题 推广 程序员的女友系列(更新到第五篇)
@ginyan 我觉得你这个得预设一个前提,第一是学生时代,第二能经常见面的,可是工作后谁也不是无业游民,没那么多时间,学生时代大家也没经济压力都靠父母,也没那么多顾虑,这些你刨除了我认为你这些经验没啥指导价值
2019 年 5 月 6 日
回复了 ginyan 创建的主题 推广 程序员的女友系列(更新到第五篇)
@Tmac15 开源啥的不是问题,我整理一下,把代码写的更正式一些,问题是这个不仅不能造福,大家可能在技术上越陷越深,最后还是一无所有,有这功夫不如想着怎么把自己打扮好点,把自己练壮点,我认为这个可能很有用。曾经问过一些女性朋友她们对那种瘦猴子觉得没有安全感不能保护她们(女性朋友不多,也行是少数这么想吧)

@ginyan 每天都是一问一答,根本约不出来

@wangchonglie 并没有什么用,只是增加一些话题量,产生一些简单共鸣,离成功还远着呢,如果是高手根本不需这个,我这种段位的用了也没啥用
2019 年 5 月 6 日
回复了 ginyan 创建的主题 推广 程序员的女友系列(更新到第五篇)
兄弟我完全跟你相反啊。。

之前认识了一个非常漂亮的女孩子啊,礼貌性的交换了微信,然后就开始 Q&A 模式,基本上都是我一问她一答,真的非常累,秉着程序员对技术的执著,我就想了是不是因为我情商太低,我完全不知道她喜欢什么,于是我萌生了通过 NLP 去挖掘她喜好和性格特点,这样我不就可以弥补”情商“了嘛,而且还能省力!(想想都觉得我机智)

收集数据:

1.把妹子发过的所有原创微博抓下来
2. 把微信朋友圈所有转发的链接和公众号文章(手动采集)
3. 过去半年的天气数据(大家会很困惑,我后面会解释)

我的目的是想更了解妹子喜好和禁区以及如何激发她表达的欲望,所以需要做几个维度:情感标注、命名实体识别、主题挖掘、协同过滤和综合相关系数,我大概觉得能 cover 的类型数据应该有几类:

- 电影娱乐(数据从豆瓣上抓影评)
- 心灵鸡汤(这个找了好多数据源)
- 各种名著书籍(妹子是学文学的,推测应该喜欢这个,数据来源很多)
- 各种社会新闻( zhihu 和网易新闻)
- 评论数据(用的美团的评论)

模型训练:

- 命名识别标注,通过 jieba POS 识别,主要识别人名&地名,做一个组合
- 情感标注,通过 SVM 跑评论数据
- 主题挖掘,通过 SLDA 设置 100 个 topic,然后合并后最后有 40 个
- word2vec 训练找相似内容

数据挖掘

分析喜好
通过命名识别识别的人名和地名,分别做 tf-idf 求权重出来,把 df < 2 的全部干掉,最后出来高权重人名和地名,包含这些人名和地名的文章都可以算高价值内容(相当于阅读理解的重点)。

话题情感
然后把那几篇文章和微博拉出来,通过内容分析 topic 做一个摘要,进一步合并 topic 后做个情感标注,得到了 topic 相关的正负面信息,最终分析出来,整体情感比较偏向负面,我根据人的经验推测性格是内向型的(很有可能不对。。)。

最相关性
为了了解妹子喜欢什么,用 word2vec 跑出来最相近的书籍、地名和美食,方便我去找更多共同话题

天气因素
这个是受到英国人的启发,没事聊天气,于是我用 naive bayes 分析了情感正负面与天气的关系,最后结论是,影响不大,但是她不喜欢下雨(雨天的时候喜欢发一些负面的东西,很有可能是样本的问题)

数据画像
有了以上数据后,大概基本上掌握了性格特点,通过一顿操作后,做了一些数据完善(过程太长省略了),最终确定了画像结果


说一下最终的结果吧,跟妹子聊天确实话题变多了,隔着屏幕都能感觉她很开心,我就更开心了,但是依然没有改变一问一答的情况,我只能放弃了。大家要引以为戒不要学我这么傻!
2019 年 4 月 28 日
回复了 tuding 创建的主题 分享发现 我总结了一个"电影院定律"
我来抬个杠,如果你家里是开电影院的,你可以选择早上 7 点包场去看电影,这样就不会有问题。2333
2019 年 4 月 23 日
回复了 dying4death 创建的主题 职场话题 答应了的 Offer 能反悔吗
你先得确定你到底是给你发的是 offer 协议,还是卖身契
2019 年 4 月 23 日
回复了 SlipStupig 创建的主题 情感问题 成年程序猿/媛都是如何找到另一半的呢?
@FEDT 两件事我都能做到,我就不担心了,问题是如何做到?
2019 年 4 月 23 日
回复了 SlipStupig 创建的主题 情感问题 成年程序猿/媛都是如何找到另一半的呢?
@shpdnx 问题是不知道跟人聊啥
2019 年 4 月 23 日
回复了 SlipStupig 创建的主题 情感问题 成年程序猿/媛都是如何找到另一半的呢?
@dove1011 你怎么知道是咋回事呢。。
2019 年 4 月 22 日
回复了 SlipStupig 创建的主题 情感问题 成年程序猿/媛都是如何找到另一半的呢?
@miao666 都是未知没遇到骗子,都很优秀就是见面后很尴尬
2019 年 4 月 22 日
回复了 SlipStupig 创建的主题 情感问题 成年程序猿/媛都是如何找到另一半的呢?
@dove1011 妹子不是很容易脱单么
2019 年 4 月 21 日
回复了 go 创建的主题 问与答 不会打王者荣耀,是否影响融入团队
如果你没坐过牢,你还会少认识很多狱友,那里面个个都是人才,说话又好听,你觉得遗憾不?
With great power comes great responsibility
1 ... 12  13  14  15  16  17  18  19  20  21 ... 90  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   975 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 52ms · UTC 20:02 · PVG 04:02 · LAX 13:02 · JFK 16:02
♥ Do have faith in what you're doing.