想了想,还是发个帖回复下大家问题来的更正式些
围观了大家这么多积极的讨论,我也来发表下自己的观点,这是第一次,也将是最后一次。
先说最关键的一点,我不是任何明星的粉和黑,没有专门针对哪位明星,只是单纯的喜欢数据分析。我在去年就在组里分析过其他剧集数据,那时也被打上过其他粉籍,之所以会这样也是豆瓣生态使然,我很理解。不管质疑我的人相不相信我,我只是在追踪最近各大流量的在播剧集,只是好巧不巧,最后分析出的数据,都指向了曾经给某位明星作品打5星好评的部分豆瓣用户。现在多说无益,我后续的数据分析帖,会帮我证明我没有针对哪位明星,也欢迎大家继续一起和我讨论数据。以及部分组员说我为何专门针对国色拉长了数据采集周期的问题,我想说,有没有可能是我为了让国色数据不会被对比的更惨烈,而刻意拉长了下时间,这一点,连其他演员的剧粉都看出来了,为何国色剧粉却没看出。未来我会对不同分析方向都制定统一标准,数据该是怎样就是怎样。
正如前面管理员所说,我从头到尾都在讨论的是豆瓣短评区数据问题,不仅从来没有说过短评样本分型等价于整体评分分型,而且还在《滤镜》预测帖子的主楼,专门声明过我采集到的短评样本分型会和整体评分分型分布不一样,所以不管是我对《滤镜》整体评分分型的预测,还是最终评分预测(我预测帖里出于保守写了7-7.5之间,而且实际上我个人预测的具体分数就是7.3分)都是正确的,我不觉得自己出了什么问题,也没觉得翻车。相反,数据组的组员拿着一张短评采样分型和整体评分的分型拼接图去进行所谓打假,行为实在不够严谨。
更正一下一位管理员所说的错误,豆瓣短评区短评展示是依据时间和热度展现的,大家在同一时间看到的短评区数据都是一样的,不会因人而异,而我收集的就是短评区实时刷新出来的所有最新短评,不管豆瓣是依照什么算法展现短评的,只要知道,在相同的短评收集和分析策略下,结合《滤镜》、《北上》和《国色芳华》的差评用户历史评分喜好分析来看,给杨紫作品打5星但同时给相关演员作品打1星的人数,就是比给其他某演员作品打5星但同时给相关演员作品打1星的人数多不少,而这点也可以和部分同学收集到的其它信息互相印证。同时,我在分析不同剧集时,也体现出了各家散粉之间的摩擦关系,以及哪些剧集很大概率是养号剧、在分析《北上》数据时,也很准确的展现了《追风者》等剧集信息。当然,如果部分组员还是认为我收集到的数据有问题(虽然我的数据已经被多方交叉验证可信),或者认为豆瓣短评区展示算法,对曾经给杨紫作品5星的用户所打出的差评数据不友好,那我也无能为力了。我的理解是,与其空口质疑我的数据作假,都不如拿出一篇有实质性内容的数据分析帖去反驳我来的更有效果。
还有大家说的所谓周五见,说实话,有没有可能是上班狗周五晚上才得空发帖。再有就是做哪些剧的问题,我接下来还会继续追踪各大流量即将上的剧集,也会继续发出分析帖,我喜欢分析数据,并不会因为今天的小插曲而半途而废。此外,我不会仅限于豆瓣数据分析,未来我还会继续发其它类型的数据分析帖。
最后附上《滤镜》、《北上》和《国色芳华》在统一分析维度下的数据对比,算是对这个小插曲的一个收尾吧。
1. 《滤镜》:先筛选2025.2.24-2025.2.27号开播前四天给《滤镜》打差评(1星&2星)的用户,然后再统计对应用户在2025.2.27号及其之前的历史作品评分喜好情况。
2. 《北上》:先筛选2025.3.3-2025.3.6号开播前四天给《北上》打差评(1星&2星)的用户,然后再统计对应用户在2025.3.6号及其之前的历史作品评分喜好情况。
3. 《国色芳华》:先筛选2025.1.7-2025.1.10号开播前四天给《国色芳华》打差评(1星&2星)的用户,然后再统计对应用户在2025.1.10号及其之前的历史作品评分喜好情况。
网址:想了想,还是发个帖回复下大家问题来的更正式些 http://www.mxgxt.com/news/view/914878
相关内容
李凡秀否认离婚传闻,称妻子李允真发布的帖子是“个人问题”【内含福利】《全明星足球》常见问题答疑+反馈问题收集帖
考研采访问题有哪些,要采访一个考研成功的学姐帮我想几个有价值的问题
过年回家最怕被问到的10个问题,个个戳心窝
全明星投票正式开启!詹姆斯回应赛事改制:投太多三分才是更大问题
邓伦想了解粉丝内心的这个问题,揭示了什么?
好好想想这个问题,看你会怎样回答…
林丹想找徐峥“囧一下”:娱乐圈没大家想得复杂
金星“毒舌”?终于看到金星在节目上正式回答这个问题了!
有些明星上节目,不管被问到什么问题,都会回答“是朋友”(你想到了哪个明星?