Files
stock_cursor_v0/功能拓展/社区情绪监控使用说明.md
2026-06-14 11:54:45 +08:00

547 lines
11 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 社区情绪监控使用说明
## 功能概述
社区情绪监控模块通过爬取和分析东方财富、雪球等社区的热帖,量化散户情绪,提供反向投资指标。
**核心理念**:散户情绪往往是反向指标,当市场情绪极度乐观时可能是顶部,极度悲观时可能是底部。
---
## 五大核心功能
### 1. 情绪指数
**功能说明**
统计社区帖子的情绪倾向(乐观/悲观/中性),计算情绪指数。
**情绪分类**
| 情绪 | 关键词示例 | 判断逻辑 |
|------|------------|----------|
| **乐观Bullish** | 看多、买入、突破、暴涨、牛市 | 包含2个及以上乐观关键词 |
| **悲观Bearish** | 看空、卖出、下跌、暴跌、熊市 | 包含2个及以上悲观关键词 |
| **中性Neutral** | 其他 | 情绪关键词不明显 |
**情绪指数定义**
```
乐观比例 = 乐观帖子数 / 总帖子数 × 100%
```
**反向指标解读**
| 乐观比例 | 市场状态 | 投资建议 |
|----------|----------|----------|
| **≥ 80%** | 极度乐观 | ⚠️ 警惕顶部,考虑减仓 |
| **60-80%** | 偏乐观 | 谨慎操作,不追高 |
| **40-60%** | 中性 | 正常波动 |
| **20-40%** | 偏悲观 | 关注机会,可适当建仓 |
| **< 20%** | 极度悲观 | ✅ 可能是底部,积极布局 |
**使用步骤**
1. 进入"社区情绪" → "情绪指数"
2. 点击"采集数据"(爬取最新帖子)
3. 点击"计算指数"
4. 查看乐观比例和历史趋势
**实战案例**
```
案例12021年2月牛市顶部
乐观比例92%
市场状态:极度乐观,到处都是"牛市来了""万点不是梦"
实际走势:随后进入长达一年的调整
案例22022年10月熊市底部
乐观比例18%
市场状态:极度悲观,"A股药丸""永不回本"
实际走势:随后开启反弹
```
---
### 2. 热议股票排行
**功能说明**
统计最近N天讨论量最高的股票识别市场热点。
**热度评分公式**
```
热度 = 帖子数 × 10 + 评论数
```
**讨论量激增预警**
当某只股票的讨论量突然激增,往往意味着:
**正面信号**(早期):
- 新热点启动
- 基本面改善引发关注
- 可能是买入机会
⚠️ **负面信号**(后期):
- 追高情绪蔓延
- 可能接近短期顶部
- 谨慎追高
**使用技巧**
**技巧1结合股价走势**
```
如果热议股票尚未大涨(涨幅 < 10%
→ 可能是早期机会,值得关注
如果热议股票已经暴涨(涨幅 > 30%
→ 可能是追高情绪,谨慎介入
```
**技巧2观察持续性**
```
连续3天以上热议 + 股价稳步上涨:
→ 趋势较强,可跟踪
突然冲上热议榜 + 股价暴涨:
→ 情绪性炒作,风险较高
```
---
### 3. 关键词云图
**功能说明**
提取社区帖子的高频关键词,直观展示当前市场关注焦点。
**关键词提取**
- 使用jieba分词
- 过滤停用词
- 统计词频
- 生成词云可视化
**市场风格识别**
通过关键词可以快速判断市场风格:
**科技成长风格**
```
高频词:芯片、半导体、人工智能、新能源、锂电池
→ 市场偏好科技成长股
```
**价值防守风格**
```
高频词:银行、地产、煤炭、分红、低估值
→ 市场偏好价值股
```
**题材炒作风格**
```
高频词:妖股、涨停、龙头、超短线、打板
→ 市场投机氛围浓厚
```
**恐慌风格**
```
高频词:暴跌、崩盘、止损、割肉、被套
→ 市场恐慌,可能接近底部
```
**使用场景**
**场景1识别热点板块**
```
观察到关键词:"芯片" "半导体" "国产替代"
→ 半导体板块成为焦点
→ 可关注板块内龙头股
```
**场景2判断市场情绪**
```
关键词大部分是负面词汇(暴跌、止损、割肉)
→ 市场情绪悲观
→ 可能是抄底机会
```
---
### 4. 情绪与股价相关性
**功能说明**
分析特定股票的社区情绪与股价涨跌的相关性,验证是否为反向指标。
**相关系数解读**
| 相关系数 | 关系 | 投资启示 |
|----------|------|----------|
| **0.7 ~ 1.0** | 强正相关 | 情绪高涨时股价上涨,同步指标 |
| **0.3 ~ 0.7** | 中度正相关 | 有一定同步性 |
| **-0.3 ~ 0.3** | 弱相关 | 情绪与股价关系不明显 |
| **-0.7 ~ -0.3** | 中度负相关 | **反向指标**,情绪越乐观越要警惕 |
| **-1.0 ~ -0.7** | 强负相关 | **典型反向指标** |
**典型案例**
**案例1茅台强负相关 -0.65**
```
现象:
- 股价在1800元时社区讨论热烈乐观情绪爆棚
- 股价在1500元时社区骂声一片极度悲观
结论:
- 典型的反向指标
- 情绪越乐观越要警惕顶部
- 情绪越悲观越是买入机会
策略:
- 当乐观比例 > 80% 时减仓
- 当乐观比例 < 30% 时加仓
```
**案例2某妖股强正相关 +0.78**
```
现象:
- 股价暴涨时,社区疯狂吹捧
- 股价暴跌时,社区立刻转空
结论:
- 追涨杀跌的投机股
- 情绪和股价同步
- 不适合做反向指标
策略:
- 避免追高
- 等待冷静后再介入
```
**使用步骤**
1. 进入"社区情绪" → "情绪相关性"
2. 输入股票代码如600519
3. 点击"分析"
4. 查看相关系数和双曲线图
5. 根据相关性制定策略
---
### 5. 数据采集
**数据源**
- 东方财富股吧
- 雪球
- 其他社区(可扩展)
**采集内容**
- 帖子标题
- 帖子内容
- 评论数
- 浏览量
- 发布时间
**采集频率建议**
- **盘中**每1-2小时采集一次
- **盘后**:每天收盘后采集一次
- **周末**:可暂停采集
**数据处理流程**
```
1. 爬取帖子
2. 去重(避免重复采集)
3. 情绪分析(乐观/悲观/中性)
4. 关键词提取
5. 股票代码提取
6. 存入数据库
7. 计算情绪指数
```
**注意事项**
1. **反爬限制**
- 当前版本返回模拟数据
- 实际生产需要:
- 使用代理IP
- 模拟浏览器headers
- 控制请求频率
- 处理验证码
2. **数据质量**
- 过滤广告和垃圾帖
- 剔除机器人账号
- 去除重复内容
3. **隐私合规**
- 仅采集公开内容
- 不采集个人隐私信息
- 遵守网站robots.txt规则
---
## 反向投资策略
### 策略1情绪极值反转策略
**核心逻辑**
当情绪达到极值时,往往是反转点。
**操作规则**
**买入信号**
```
条件:
1. 乐观比例 < 20%(极度悲观)
2. 关键词以负面词为主(暴跌、割肉、崩盘)
3. 大盘或个股已经大跌(如 -20%以上)
操作:
- 分批建仓
- 设置止损(如 -10%
- 耐心等待反弹
```
**卖出信号**
```
条件:
1. 乐观比例 > 80%(极度乐观)
2. 关键词以正面词为主(暴涨、牛市、万点)
3. 大盘或个股已经大涨
操作:
- 分批减仓
- 落袋为安
- 不追高
```
---
### 策略2热议股票淘金策略
**核心逻辑**
热议股票早期可能是机会,后期可能是陷阱。
**操作规则**
**早期介入**(机会):
```
条件:
1. 讨论量开始上升首次进入前20
2. 涨幅尚小(< 10%
3. 基本面或题材有催化剂
操作:
- 小仓位试探
- 设置止盈(如 +15%
- 密切跟踪
```
**后期避让**(陷阱):
```
条件:
1. 讨论量爆发长时间霸榜前3
2. 涨幅已大(> 30%
3. 评论区一片乐观
操作:
- 不追高
- 如有持仓考虑减仓
- 等待回调
```
---
### 策略3关键词轮动策略
**核心逻辑**
跟随市场关注焦点,捕捉板块轮动。
**操作步骤**
1. **每周查看关键词云**
- 识别新出现的高频词
- 判断是否是新热点
2. **对比上周关键词**
- 哪些词热度上升(新热点)
- 哪些词热度下降(退潮板块)
3. **布局新热点**
- 在关键词刚开始高频时介入
- 选择相关板块的龙头股
4. **退出退潮板块**
- 关键词热度下降时减仓
- 及时止盈
---
## 实战案例
### 案例12022年4月底部极度悲观
**情绪数据**
```
乐观比例15%
悲观比例68%
热门关键词:暴跌、崩盘、割肉、套牢、熊市
```
**市场表现**
- 上证指数跌至2863点
- 社区一片哀嚎
- "永不回本"成为热词
**反向操作**
- 分批买入指数基金
- 买入超跌优质股
**结果**
- 随后2个月反弹20%+
- 情绪指标成功抄底
---
### 案例22023年9月某科技股讨论量激增
**情绪数据**
```
讨论量从第50名冲到第3名
涨幅连续5天涨停
评论区:全是"十倍股""抄底机会"
```
**反向判断**
- 讨论量爆发 + 已经暴涨
- 典型的追高情绪
- 短期风险较大
**操作**
- 不追高
- 等待回调后再观察
**结果**
- 随后3天连续跌停
- 成功避开风险
---
## API 接口
### POST /api/sentiment/collect
采集社区帖子
**参数**
- `limit`每个来源采集数量10-200
**响应**
```json
{
"ok": true,
"collected": 100,
"saved": 85
}
```
### GET /api/sentiment/index
获取情绪指数
**参数**
- `date`:日期(可选,默认今天)
**响应**
```json
{
"ok": true,
"date": "2024-01-15",
"bullish_count": 320,
"bearish_count": 180,
"neutral_count": 150,
"bullish_ratio": 49.23,
"total_posts": 650,
"top_keywords": [...]
}
```
### GET /api/sentiment/hot_stocks
热议股票排行
**参数**
- `days`统计天数1-7
- `limit`:返回数量(<=50
### GET /api/sentiment/wordcloud
关键词云
**参数**
- `days`统计天数1-30
- `top_n`返回前N个关键词<=100
### GET /api/sentiment/correlation
情绪与股价相关性
**参数**
- `code`:股票代码(必填)
- `days`分析天数20-180
---
## 注意事项
1. **数据时效性**
- 情绪数据需要每日更新
- 建议收盘后采集一次
2. **反向指标的局限性**
- 并非所有股票都是反向指标
- 需要结合基本面和技术面
- 极值信号出现后,反转可能需要时间
3. **样本量要求**
- 至少需要30天以上的数据
- 数据点越多,相关性分析越准确
4. **隐私和合规**
- 仅采集公开信息
- 不存储用户隐私
- 遵守网站使用条款
5. **反爬应对**
- 生产环境需要配置代理
- 控制请求频率
- 模拟真实用户行为
---
## 后续优化
- [ ] 接入更多社区数据源
- [ ] 改进情绪分析算法使用NLP模型
- [ ] 增加舆情热度趋势预警
- [ ] 支持自定义情绪关键词库
- [ ] 增加大V影响力分析
- [ ] 实时情绪监控WebSocket推送
- [ ] 情绪异常检测(突然转向)
- [ ] 历史情绪回测(验证有效性)
---
## 总结
社区情绪监控是一个**反向投资利器**,通过量化散户情绪,帮助投资者:
**识别市场极值点**(极度乐观/悲观)
**发现热点和陷阱**(讨论量激增)
**把握板块轮动**(关键词变化)
**验证反向指标**(情绪与股价相关性)
**核心理念**
当别人恐惧时我贪婪,当别人贪婪时我恐惧。
**适合人群**
- 逆向思维投资者
- 波段操作者
- 价值投资者(择时参考)
**开始使用**
进入"社区情绪" → 点击"采集数据" → 查看情绪指数 → 制定反向策略!