# 社区情绪监控使用说明 ## 功能概述 社区情绪监控模块通过爬取和分析东方财富、雪球等社区的热帖,量化散户情绪,提供反向投资指标。 **核心理念**:散户情绪往往是反向指标,当市场情绪极度乐观时可能是顶部,极度悲观时可能是底部。 --- ## 五大核心功能 ### 1. 情绪指数 **功能说明**: 统计社区帖子的情绪倾向(乐观/悲观/中性),计算情绪指数。 **情绪分类**: | 情绪 | 关键词示例 | 判断逻辑 | |------|------------|----------| | **乐观(Bullish)** | 看多、买入、突破、暴涨、牛市 | 包含2个及以上乐观关键词 | | **悲观(Bearish)** | 看空、卖出、下跌、暴跌、熊市 | 包含2个及以上悲观关键词 | | **中性(Neutral)** | 其他 | 情绪关键词不明显 | **情绪指数定义**: ``` 乐观比例 = 乐观帖子数 / 总帖子数 × 100% ``` **反向指标解读**: | 乐观比例 | 市场状态 | 投资建议 | |----------|----------|----------| | **≥ 80%** | 极度乐观 | ⚠️ 警惕顶部,考虑减仓 | | **60-80%** | 偏乐观 | 谨慎操作,不追高 | | **40-60%** | 中性 | 正常波动 | | **20-40%** | 偏悲观 | 关注机会,可适当建仓 | | **< 20%** | 极度悲观 | ✅ 可能是底部,积极布局 | **使用步骤**: 1. 进入"社区情绪" → "情绪指数" 2. 点击"采集数据"(爬取最新帖子) 3. 点击"计算指数" 4. 查看乐观比例和历史趋势 **实战案例**: ``` 案例1:2021年2月(牛市顶部) 乐观比例:92% 市场状态:极度乐观,到处都是"牛市来了""万点不是梦" 实际走势:随后进入长达一年的调整 案例2:2022年10月(熊市底部) 乐观比例:18% 市场状态:极度悲观,"A股药丸""永不回本" 实际走势:随后开启反弹 ``` --- ### 2. 热议股票排行 **功能说明**: 统计最近N天讨论量最高的股票,识别市场热点。 **热度评分公式**: ``` 热度 = 帖子数 × 10 + 评论数 ``` **讨论量激增预警**: 当某只股票的讨论量突然激增,往往意味着: ✅ **正面信号**(早期): - 新热点启动 - 基本面改善引发关注 - 可能是买入机会 ⚠️ **负面信号**(后期): - 追高情绪蔓延 - 可能接近短期顶部 - 谨慎追高 **使用技巧**: **技巧1:结合股价走势** ``` 如果热议股票尚未大涨(涨幅 < 10%): → 可能是早期机会,值得关注 如果热议股票已经暴涨(涨幅 > 30%): → 可能是追高情绪,谨慎介入 ``` **技巧2:观察持续性** ``` 连续3天以上热议 + 股价稳步上涨: → 趋势较强,可跟踪 突然冲上热议榜 + 股价暴涨: → 情绪性炒作,风险较高 ``` --- ### 3. 关键词云图 **功能说明**: 提取社区帖子的高频关键词,直观展示当前市场关注焦点。 **关键词提取**: - 使用jieba分词 - 过滤停用词 - 统计词频 - 生成词云可视化 **市场风格识别**: 通过关键词可以快速判断市场风格: **科技成长风格**: ``` 高频词:芯片、半导体、人工智能、新能源、锂电池 → 市场偏好科技成长股 ``` **价值防守风格**: ``` 高频词:银行、地产、煤炭、分红、低估值 → 市场偏好价值股 ``` **题材炒作风格**: ``` 高频词:妖股、涨停、龙头、超短线、打板 → 市场投机氛围浓厚 ``` **恐慌风格**: ``` 高频词:暴跌、崩盘、止损、割肉、被套 → 市场恐慌,可能接近底部 ``` **使用场景**: **场景1:识别热点板块** ``` 观察到关键词:"芯片" "半导体" "国产替代" → 半导体板块成为焦点 → 可关注板块内龙头股 ``` **场景2:判断市场情绪** ``` 关键词大部分是负面词汇(暴跌、止损、割肉) → 市场情绪悲观 → 可能是抄底机会 ``` --- ### 4. 情绪与股价相关性 **功能说明**: 分析特定股票的社区情绪与股价涨跌的相关性,验证是否为反向指标。 **相关系数解读**: | 相关系数 | 关系 | 投资启示 | |----------|------|----------| | **0.7 ~ 1.0** | 强正相关 | 情绪高涨时股价上涨,同步指标 | | **0.3 ~ 0.7** | 中度正相关 | 有一定同步性 | | **-0.3 ~ 0.3** | 弱相关 | 情绪与股价关系不明显 | | **-0.7 ~ -0.3** | 中度负相关 | **反向指标**,情绪越乐观越要警惕 | | **-1.0 ~ -0.7** | 强负相关 | **典型反向指标** | **典型案例**: **案例1:茅台(强负相关 -0.65)** ``` 现象: - 股价在1800元时,社区讨论热烈,乐观情绪爆棚 - 股价在1500元时,社区骂声一片,极度悲观 结论: - 典型的反向指标 - 情绪越乐观越要警惕顶部 - 情绪越悲观越是买入机会 策略: - 当乐观比例 > 80% 时减仓 - 当乐观比例 < 30% 时加仓 ``` **案例2:某妖股(强正相关 +0.78)** ``` 现象: - 股价暴涨时,社区疯狂吹捧 - 股价暴跌时,社区立刻转空 结论: - 追涨杀跌的投机股 - 情绪和股价同步 - 不适合做反向指标 策略: - 避免追高 - 等待冷静后再介入 ``` **使用步骤**: 1. 进入"社区情绪" → "情绪相关性" 2. 输入股票代码(如600519) 3. 点击"分析" 4. 查看相关系数和双曲线图 5. 根据相关性制定策略 --- ### 5. 数据采集 **数据源**: - 东方财富股吧 - 雪球 - 其他社区(可扩展) **采集内容**: - 帖子标题 - 帖子内容 - 评论数 - 浏览量 - 发布时间 **采集频率建议**: - **盘中**:每1-2小时采集一次 - **盘后**:每天收盘后采集一次 - **周末**:可暂停采集 **数据处理流程**: ``` 1. 爬取帖子 ↓ 2. 去重(避免重复采集) ↓ 3. 情绪分析(乐观/悲观/中性) ↓ 4. 关键词提取 ↓ 5. 股票代码提取 ↓ 6. 存入数据库 ↓ 7. 计算情绪指数 ``` **注意事项**: 1. **反爬限制**: - 当前版本返回模拟数据 - 实际生产需要: - 使用代理IP - 模拟浏览器headers - 控制请求频率 - 处理验证码 2. **数据质量**: - 过滤广告和垃圾帖 - 剔除机器人账号 - 去除重复内容 3. **隐私合规**: - 仅采集公开内容 - 不采集个人隐私信息 - 遵守网站robots.txt规则 --- ## 反向投资策略 ### 策略1:情绪极值反转策略 **核心逻辑**: 当情绪达到极值时,往往是反转点。 **操作规则**: **买入信号**: ``` 条件: 1. 乐观比例 < 20%(极度悲观) 2. 关键词以负面词为主(暴跌、割肉、崩盘) 3. 大盘或个股已经大跌(如 -20%以上) 操作: - 分批建仓 - 设置止损(如 -10%) - 耐心等待反弹 ``` **卖出信号**: ``` 条件: 1. 乐观比例 > 80%(极度乐观) 2. 关键词以正面词为主(暴涨、牛市、万点) 3. 大盘或个股已经大涨 操作: - 分批减仓 - 落袋为安 - 不追高 ``` --- ### 策略2:热议股票淘金策略 **核心逻辑**: 热议股票早期可能是机会,后期可能是陷阱。 **操作规则**: **早期介入**(机会): ``` 条件: 1. 讨论量开始上升(首次进入前20) 2. 涨幅尚小(< 10%) 3. 基本面或题材有催化剂 操作: - 小仓位试探 - 设置止盈(如 +15%) - 密切跟踪 ``` **后期避让**(陷阱): ``` 条件: 1. 讨论量爆发(长时间霸榜前3) 2. 涨幅已大(> 30%) 3. 评论区一片乐观 操作: - 不追高 - 如有持仓考虑减仓 - 等待回调 ``` --- ### 策略3:关键词轮动策略 **核心逻辑**: 跟随市场关注焦点,捕捉板块轮动。 **操作步骤**: 1. **每周查看关键词云** - 识别新出现的高频词 - 判断是否是新热点 2. **对比上周关键词** - 哪些词热度上升(新热点) - 哪些词热度下降(退潮板块) 3. **布局新热点** - 在关键词刚开始高频时介入 - 选择相关板块的龙头股 4. **退出退潮板块** - 关键词热度下降时减仓 - 及时止盈 --- ## 实战案例 ### 案例1:2022年4月底部(极度悲观) **情绪数据**: ``` 乐观比例:15% 悲观比例:68% 热门关键词:暴跌、崩盘、割肉、套牢、熊市 ``` **市场表现**: - 上证指数跌至2863点 - 社区一片哀嚎 - "永不回本"成为热词 **反向操作**: - 分批买入指数基金 - 买入超跌优质股 **结果**: - 随后2个月反弹20%+ - 情绪指标成功抄底 --- ### 案例2:2023年9月某科技股(讨论量激增) **情绪数据**: ``` 讨论量:从第50名冲到第3名 涨幅:连续5天涨停 评论区:全是"十倍股""抄底机会" ``` **反向判断**: - 讨论量爆发 + 已经暴涨 - 典型的追高情绪 - 短期风险较大 **操作**: - 不追高 - 等待回调后再观察 **结果**: - 随后3天连续跌停 - 成功避开风险 --- ## API 接口 ### POST /api/sentiment/collect 采集社区帖子 **参数**: - `limit`:每个来源采集数量(10-200) **响应**: ```json { "ok": true, "collected": 100, "saved": 85 } ``` ### GET /api/sentiment/index 获取情绪指数 **参数**: - `date`:日期(可选,默认今天) **响应**: ```json { "ok": true, "date": "2024-01-15", "bullish_count": 320, "bearish_count": 180, "neutral_count": 150, "bullish_ratio": 49.23, "total_posts": 650, "top_keywords": [...] } ``` ### GET /api/sentiment/hot_stocks 热议股票排行 **参数**: - `days`:统计天数(1-7) - `limit`:返回数量(<=50) ### GET /api/sentiment/wordcloud 关键词云 **参数**: - `days`:统计天数(1-30) - `top_n`:返回前N个关键词(<=100) ### GET /api/sentiment/correlation 情绪与股价相关性 **参数**: - `code`:股票代码(必填) - `days`:分析天数(20-180) --- ## 注意事项 1. **数据时效性**: - 情绪数据需要每日更新 - 建议收盘后采集一次 2. **反向指标的局限性**: - 并非所有股票都是反向指标 - 需要结合基本面和技术面 - 极值信号出现后,反转可能需要时间 3. **样本量要求**: - 至少需要30天以上的数据 - 数据点越多,相关性分析越准确 4. **隐私和合规**: - 仅采集公开信息 - 不存储用户隐私 - 遵守网站使用条款 5. **反爬应对**: - 生产环境需要配置代理 - 控制请求频率 - 模拟真实用户行为 --- ## 后续优化 - [ ] 接入更多社区数据源 - [ ] 改进情绪分析算法(使用NLP模型) - [ ] 增加舆情热度趋势预警 - [ ] 支持自定义情绪关键词库 - [ ] 增加大V影响力分析 - [ ] 实时情绪监控(WebSocket推送) - [ ] 情绪异常检测(突然转向) - [ ] 历史情绪回测(验证有效性) --- ## 总结 社区情绪监控是一个**反向投资利器**,通过量化散户情绪,帮助投资者: ✅ **识别市场极值点**(极度乐观/悲观) ✅ **发现热点和陷阱**(讨论量激增) ✅ **把握板块轮动**(关键词变化) ✅ **验证反向指标**(情绪与股价相关性) **核心理念**: 当别人恐惧时我贪婪,当别人贪婪时我恐惧。 **适合人群**: - 逆向思维投资者 - 波段操作者 - 价值投资者(择时参考) **开始使用**: 进入"社区情绪" → 点击"采集数据" → 查看情绪指数 → 制定反向策略!