11 KiB
社区情绪监控使用说明
功能概述
社区情绪监控模块通过爬取和分析东方财富、雪球等社区的热帖,量化散户情绪,提供反向投资指标。
核心理念:散户情绪往往是反向指标,当市场情绪极度乐观时可能是顶部,极度悲观时可能是底部。
五大核心功能
1. 情绪指数
功能说明: 统计社区帖子的情绪倾向(乐观/悲观/中性),计算情绪指数。
情绪分类:
| 情绪 | 关键词示例 | 判断逻辑 |
|---|---|---|
| 乐观(Bullish) | 看多、买入、突破、暴涨、牛市 | 包含2个及以上乐观关键词 |
| 悲观(Bearish) | 看空、卖出、下跌、暴跌、熊市 | 包含2个及以上悲观关键词 |
| 中性(Neutral) | 其他 | 情绪关键词不明显 |
情绪指数定义:
乐观比例 = 乐观帖子数 / 总帖子数 × 100%
反向指标解读:
| 乐观比例 | 市场状态 | 投资建议 |
|---|---|---|
| ≥ 80% | 极度乐观 | ⚠️ 警惕顶部,考虑减仓 |
| 60-80% | 偏乐观 | 谨慎操作,不追高 |
| 40-60% | 中性 | 正常波动 |
| 20-40% | 偏悲观 | 关注机会,可适当建仓 |
| < 20% | 极度悲观 | ✅ 可能是底部,积极布局 |
使用步骤:
- 进入"社区情绪" → "情绪指数"
- 点击"采集数据"(爬取最新帖子)
- 点击"计算指数"
- 查看乐观比例和历史趋势
实战案例:
案例1:2021年2月(牛市顶部)
乐观比例:92%
市场状态:极度乐观,到处都是"牛市来了""万点不是梦"
实际走势:随后进入长达一年的调整
案例2:2022年10月(熊市底部)
乐观比例:18%
市场状态:极度悲观,"A股药丸""永不回本"
实际走势:随后开启反弹
2. 热议股票排行
功能说明: 统计最近N天讨论量最高的股票,识别市场热点。
热度评分公式:
热度 = 帖子数 × 10 + 评论数
讨论量激增预警:
当某只股票的讨论量突然激增,往往意味着:
✅ 正面信号(早期):
- 新热点启动
- 基本面改善引发关注
- 可能是买入机会
⚠️ 负面信号(后期):
- 追高情绪蔓延
- 可能接近短期顶部
- 谨慎追高
使用技巧:
技巧1:结合股价走势
如果热议股票尚未大涨(涨幅 < 10%):
→ 可能是早期机会,值得关注
如果热议股票已经暴涨(涨幅 > 30%):
→ 可能是追高情绪,谨慎介入
技巧2:观察持续性
连续3天以上热议 + 股价稳步上涨:
→ 趋势较强,可跟踪
突然冲上热议榜 + 股价暴涨:
→ 情绪性炒作,风险较高
3. 关键词云图
功能说明: 提取社区帖子的高频关键词,直观展示当前市场关注焦点。
关键词提取:
- 使用jieba分词
- 过滤停用词
- 统计词频
- 生成词云可视化
市场风格识别:
通过关键词可以快速判断市场风格:
科技成长风格:
高频词:芯片、半导体、人工智能、新能源、锂电池
→ 市场偏好科技成长股
价值防守风格:
高频词:银行、地产、煤炭、分红、低估值
→ 市场偏好价值股
题材炒作风格:
高频词:妖股、涨停、龙头、超短线、打板
→ 市场投机氛围浓厚
恐慌风格:
高频词:暴跌、崩盘、止损、割肉、被套
→ 市场恐慌,可能接近底部
使用场景:
场景1:识别热点板块
观察到关键词:"芯片" "半导体" "国产替代"
→ 半导体板块成为焦点
→ 可关注板块内龙头股
场景2:判断市场情绪
关键词大部分是负面词汇(暴跌、止损、割肉)
→ 市场情绪悲观
→ 可能是抄底机会
4. 情绪与股价相关性
功能说明: 分析特定股票的社区情绪与股价涨跌的相关性,验证是否为反向指标。
相关系数解读:
| 相关系数 | 关系 | 投资启示 |
|---|---|---|
| 0.7 ~ 1.0 | 强正相关 | 情绪高涨时股价上涨,同步指标 |
| 0.3 ~ 0.7 | 中度正相关 | 有一定同步性 |
| -0.3 ~ 0.3 | 弱相关 | 情绪与股价关系不明显 |
| -0.7 ~ -0.3 | 中度负相关 | 反向指标,情绪越乐观越要警惕 |
| -1.0 ~ -0.7 | 强负相关 | 典型反向指标 |
典型案例:
案例1:茅台(强负相关 -0.65)
现象:
- 股价在1800元时,社区讨论热烈,乐观情绪爆棚
- 股价在1500元时,社区骂声一片,极度悲观
结论:
- 典型的反向指标
- 情绪越乐观越要警惕顶部
- 情绪越悲观越是买入机会
策略:
- 当乐观比例 > 80% 时减仓
- 当乐观比例 < 30% 时加仓
案例2:某妖股(强正相关 +0.78)
现象:
- 股价暴涨时,社区疯狂吹捧
- 股价暴跌时,社区立刻转空
结论:
- 追涨杀跌的投机股
- 情绪和股价同步
- 不适合做反向指标
策略:
- 避免追高
- 等待冷静后再介入
使用步骤:
- 进入"社区情绪" → "情绪相关性"
- 输入股票代码(如600519)
- 点击"分析"
- 查看相关系数和双曲线图
- 根据相关性制定策略
5. 数据采集
数据源:
- 东方财富股吧
- 雪球
- 其他社区(可扩展)
采集内容:
- 帖子标题
- 帖子内容
- 评论数
- 浏览量
- 发布时间
采集频率建议:
- 盘中:每1-2小时采集一次
- 盘后:每天收盘后采集一次
- 周末:可暂停采集
数据处理流程:
1. 爬取帖子
↓
2. 去重(避免重复采集)
↓
3. 情绪分析(乐观/悲观/中性)
↓
4. 关键词提取
↓
5. 股票代码提取
↓
6. 存入数据库
↓
7. 计算情绪指数
注意事项:
-
反爬限制:
- 当前版本返回模拟数据
- 实际生产需要:
- 使用代理IP
- 模拟浏览器headers
- 控制请求频率
- 处理验证码
-
数据质量:
- 过滤广告和垃圾帖
- 剔除机器人账号
- 去除重复内容
-
隐私合规:
- 仅采集公开内容
- 不采集个人隐私信息
- 遵守网站robots.txt规则
反向投资策略
策略1:情绪极值反转策略
核心逻辑: 当情绪达到极值时,往往是反转点。
操作规则:
买入信号:
条件:
1. 乐观比例 < 20%(极度悲观)
2. 关键词以负面词为主(暴跌、割肉、崩盘)
3. 大盘或个股已经大跌(如 -20%以上)
操作:
- 分批建仓
- 设置止损(如 -10%)
- 耐心等待反弹
卖出信号:
条件:
1. 乐观比例 > 80%(极度乐观)
2. 关键词以正面词为主(暴涨、牛市、万点)
3. 大盘或个股已经大涨
操作:
- 分批减仓
- 落袋为安
- 不追高
策略2:热议股票淘金策略
核心逻辑: 热议股票早期可能是机会,后期可能是陷阱。
操作规则:
早期介入(机会):
条件:
1. 讨论量开始上升(首次进入前20)
2. 涨幅尚小(< 10%)
3. 基本面或题材有催化剂
操作:
- 小仓位试探
- 设置止盈(如 +15%)
- 密切跟踪
后期避让(陷阱):
条件:
1. 讨论量爆发(长时间霸榜前3)
2. 涨幅已大(> 30%)
3. 评论区一片乐观
操作:
- 不追高
- 如有持仓考虑减仓
- 等待回调
策略3:关键词轮动策略
核心逻辑: 跟随市场关注焦点,捕捉板块轮动。
操作步骤:
-
每周查看关键词云
- 识别新出现的高频词
- 判断是否是新热点
-
对比上周关键词
- 哪些词热度上升(新热点)
- 哪些词热度下降(退潮板块)
-
布局新热点
- 在关键词刚开始高频时介入
- 选择相关板块的龙头股
-
退出退潮板块
- 关键词热度下降时减仓
- 及时止盈
实战案例
案例1:2022年4月底部(极度悲观)
情绪数据:
乐观比例:15%
悲观比例:68%
热门关键词:暴跌、崩盘、割肉、套牢、熊市
市场表现:
- 上证指数跌至2863点
- 社区一片哀嚎
- "永不回本"成为热词
反向操作:
- 分批买入指数基金
- 买入超跌优质股
结果:
- 随后2个月反弹20%+
- 情绪指标成功抄底
案例2:2023年9月某科技股(讨论量激增)
情绪数据:
讨论量:从第50名冲到第3名
涨幅:连续5天涨停
评论区:全是"十倍股""抄底机会"
反向判断:
- 讨论量爆发 + 已经暴涨
- 典型的追高情绪
- 短期风险较大
操作:
- 不追高
- 等待回调后再观察
结果:
- 随后3天连续跌停
- 成功避开风险
API 接口
POST /api/sentiment/collect
采集社区帖子
参数:
limit:每个来源采集数量(10-200)
响应:
{
"ok": true,
"collected": 100,
"saved": 85
}
GET /api/sentiment/index
获取情绪指数
参数:
date:日期(可选,默认今天)
响应:
{
"ok": true,
"date": "2024-01-15",
"bullish_count": 320,
"bearish_count": 180,
"neutral_count": 150,
"bullish_ratio": 49.23,
"total_posts": 650,
"top_keywords": [...]
}
GET /api/sentiment/hot_stocks
热议股票排行
参数:
days:统计天数(1-7)limit:返回数量(<=50)
GET /api/sentiment/wordcloud
关键词云
参数:
days:统计天数(1-30)top_n:返回前N个关键词(<=100)
GET /api/sentiment/correlation
情绪与股价相关性
参数:
code:股票代码(必填)days:分析天数(20-180)
注意事项
-
数据时效性:
- 情绪数据需要每日更新
- 建议收盘后采集一次
-
反向指标的局限性:
- 并非所有股票都是反向指标
- 需要结合基本面和技术面
- 极值信号出现后,反转可能需要时间
-
样本量要求:
- 至少需要30天以上的数据
- 数据点越多,相关性分析越准确
-
隐私和合规:
- 仅采集公开信息
- 不存储用户隐私
- 遵守网站使用条款
-
反爬应对:
- 生产环境需要配置代理
- 控制请求频率
- 模拟真实用户行为
后续优化
- 接入更多社区数据源
- 改进情绪分析算法(使用NLP模型)
- 增加舆情热度趋势预警
- 支持自定义情绪关键词库
- 增加大V影响力分析
- 实时情绪监控(WebSocket推送)
- 情绪异常检测(突然转向)
- 历史情绪回测(验证有效性)
总结
社区情绪监控是一个反向投资利器,通过量化散户情绪,帮助投资者:
✅ 识别市场极值点(极度乐观/悲观) ✅ 发现热点和陷阱(讨论量激增) ✅ 把握板块轮动(关键词变化) ✅ 验证反向指标(情绪与股价相关性)
核心理念: 当别人恐惧时我贪婪,当别人贪婪时我恐惧。
适合人群:
- 逆向思维投资者
- 波段操作者
- 价值投资者(择时参考)
开始使用: 进入"社区情绪" → 点击"采集数据" → 查看情绪指数 → 制定反向策略!