claude强化功能

This commit is contained in:
2026-06-14 11:54:45 +08:00
parent cc8dff4e57
commit e524a3589a
43 changed files with 13421 additions and 73 deletions

View File

@@ -0,0 +1,546 @@
# 社区情绪监控使用说明
## 功能概述
社区情绪监控模块通过爬取和分析东方财富、雪球等社区的热帖,量化散户情绪,提供反向投资指标。
**核心理念**:散户情绪往往是反向指标,当市场情绪极度乐观时可能是顶部,极度悲观时可能是底部。
---
## 五大核心功能
### 1. 情绪指数
**功能说明**
统计社区帖子的情绪倾向(乐观/悲观/中性),计算情绪指数。
**情绪分类**
| 情绪 | 关键词示例 | 判断逻辑 |
|------|------------|----------|
| **乐观Bullish** | 看多、买入、突破、暴涨、牛市 | 包含2个及以上乐观关键词 |
| **悲观Bearish** | 看空、卖出、下跌、暴跌、熊市 | 包含2个及以上悲观关键词 |
| **中性Neutral** | 其他 | 情绪关键词不明显 |
**情绪指数定义**
```
乐观比例 = 乐观帖子数 / 总帖子数 × 100%
```
**反向指标解读**
| 乐观比例 | 市场状态 | 投资建议 |
|----------|----------|----------|
| **≥ 80%** | 极度乐观 | ⚠️ 警惕顶部,考虑减仓 |
| **60-80%** | 偏乐观 | 谨慎操作,不追高 |
| **40-60%** | 中性 | 正常波动 |
| **20-40%** | 偏悲观 | 关注机会,可适当建仓 |
| **< 20%** | 极度悲观 | ✅ 可能是底部,积极布局 |
**使用步骤**
1. 进入"社区情绪" → "情绪指数"
2. 点击"采集数据"(爬取最新帖子)
3. 点击"计算指数"
4. 查看乐观比例和历史趋势
**实战案例**
```
案例12021年2月牛市顶部
乐观比例92%
市场状态:极度乐观,到处都是"牛市来了""万点不是梦"
实际走势:随后进入长达一年的调整
案例22022年10月熊市底部
乐观比例18%
市场状态:极度悲观,"A股药丸""永不回本"
实际走势:随后开启反弹
```
---
### 2. 热议股票排行
**功能说明**
统计最近N天讨论量最高的股票识别市场热点。
**热度评分公式**
```
热度 = 帖子数 × 10 + 评论数
```
**讨论量激增预警**
当某只股票的讨论量突然激增,往往意味着:
**正面信号**(早期):
- 新热点启动
- 基本面改善引发关注
- 可能是买入机会
⚠️ **负面信号**(后期):
- 追高情绪蔓延
- 可能接近短期顶部
- 谨慎追高
**使用技巧**
**技巧1结合股价走势**
```
如果热议股票尚未大涨(涨幅 < 10%
→ 可能是早期机会,值得关注
如果热议股票已经暴涨(涨幅 > 30%
→ 可能是追高情绪,谨慎介入
```
**技巧2观察持续性**
```
连续3天以上热议 + 股价稳步上涨:
→ 趋势较强,可跟踪
突然冲上热议榜 + 股价暴涨:
→ 情绪性炒作,风险较高
```
---
### 3. 关键词云图
**功能说明**
提取社区帖子的高频关键词,直观展示当前市场关注焦点。
**关键词提取**
- 使用jieba分词
- 过滤停用词
- 统计词频
- 生成词云可视化
**市场风格识别**
通过关键词可以快速判断市场风格:
**科技成长风格**
```
高频词:芯片、半导体、人工智能、新能源、锂电池
→ 市场偏好科技成长股
```
**价值防守风格**
```
高频词:银行、地产、煤炭、分红、低估值
→ 市场偏好价值股
```
**题材炒作风格**
```
高频词:妖股、涨停、龙头、超短线、打板
→ 市场投机氛围浓厚
```
**恐慌风格**
```
高频词:暴跌、崩盘、止损、割肉、被套
→ 市场恐慌,可能接近底部
```
**使用场景**
**场景1识别热点板块**
```
观察到关键词:"芯片" "半导体" "国产替代"
→ 半导体板块成为焦点
→ 可关注板块内龙头股
```
**场景2判断市场情绪**
```
关键词大部分是负面词汇(暴跌、止损、割肉)
→ 市场情绪悲观
→ 可能是抄底机会
```
---
### 4. 情绪与股价相关性
**功能说明**
分析特定股票的社区情绪与股价涨跌的相关性,验证是否为反向指标。
**相关系数解读**
| 相关系数 | 关系 | 投资启示 |
|----------|------|----------|
| **0.7 ~ 1.0** | 强正相关 | 情绪高涨时股价上涨,同步指标 |
| **0.3 ~ 0.7** | 中度正相关 | 有一定同步性 |
| **-0.3 ~ 0.3** | 弱相关 | 情绪与股价关系不明显 |
| **-0.7 ~ -0.3** | 中度负相关 | **反向指标**,情绪越乐观越要警惕 |
| **-1.0 ~ -0.7** | 强负相关 | **典型反向指标** |
**典型案例**
**案例1茅台强负相关 -0.65**
```
现象:
- 股价在1800元时社区讨论热烈乐观情绪爆棚
- 股价在1500元时社区骂声一片极度悲观
结论:
- 典型的反向指标
- 情绪越乐观越要警惕顶部
- 情绪越悲观越是买入机会
策略:
- 当乐观比例 > 80% 时减仓
- 当乐观比例 < 30% 时加仓
```
**案例2某妖股强正相关 +0.78**
```
现象:
- 股价暴涨时,社区疯狂吹捧
- 股价暴跌时,社区立刻转空
结论:
- 追涨杀跌的投机股
- 情绪和股价同步
- 不适合做反向指标
策略:
- 避免追高
- 等待冷静后再介入
```
**使用步骤**
1. 进入"社区情绪" → "情绪相关性"
2. 输入股票代码如600519
3. 点击"分析"
4. 查看相关系数和双曲线图
5. 根据相关性制定策略
---
### 5. 数据采集
**数据源**
- 东方财富股吧
- 雪球
- 其他社区(可扩展)
**采集内容**
- 帖子标题
- 帖子内容
- 评论数
- 浏览量
- 发布时间
**采集频率建议**
- **盘中**每1-2小时采集一次
- **盘后**:每天收盘后采集一次
- **周末**:可暂停采集
**数据处理流程**
```
1. 爬取帖子
2. 去重(避免重复采集)
3. 情绪分析(乐观/悲观/中性)
4. 关键词提取
5. 股票代码提取
6. 存入数据库
7. 计算情绪指数
```
**注意事项**
1. **反爬限制**
- 当前版本返回模拟数据
- 实际生产需要:
- 使用代理IP
- 模拟浏览器headers
- 控制请求频率
- 处理验证码
2. **数据质量**
- 过滤广告和垃圾帖
- 剔除机器人账号
- 去除重复内容
3. **隐私合规**
- 仅采集公开内容
- 不采集个人隐私信息
- 遵守网站robots.txt规则
---
## 反向投资策略
### 策略1情绪极值反转策略
**核心逻辑**
当情绪达到极值时,往往是反转点。
**操作规则**
**买入信号**
```
条件:
1. 乐观比例 < 20%(极度悲观)
2. 关键词以负面词为主(暴跌、割肉、崩盘)
3. 大盘或个股已经大跌(如 -20%以上)
操作:
- 分批建仓
- 设置止损(如 -10%
- 耐心等待反弹
```
**卖出信号**
```
条件:
1. 乐观比例 > 80%(极度乐观)
2. 关键词以正面词为主(暴涨、牛市、万点)
3. 大盘或个股已经大涨
操作:
- 分批减仓
- 落袋为安
- 不追高
```
---
### 策略2热议股票淘金策略
**核心逻辑**
热议股票早期可能是机会,后期可能是陷阱。
**操作规则**
**早期介入**(机会):
```
条件:
1. 讨论量开始上升首次进入前20
2. 涨幅尚小(< 10%
3. 基本面或题材有催化剂
操作:
- 小仓位试探
- 设置止盈(如 +15%
- 密切跟踪
```
**后期避让**(陷阱):
```
条件:
1. 讨论量爆发长时间霸榜前3
2. 涨幅已大(> 30%
3. 评论区一片乐观
操作:
- 不追高
- 如有持仓考虑减仓
- 等待回调
```
---
### 策略3关键词轮动策略
**核心逻辑**
跟随市场关注焦点,捕捉板块轮动。
**操作步骤**
1. **每周查看关键词云**
- 识别新出现的高频词
- 判断是否是新热点
2. **对比上周关键词**
- 哪些词热度上升(新热点)
- 哪些词热度下降(退潮板块)
3. **布局新热点**
- 在关键词刚开始高频时介入
- 选择相关板块的龙头股
4. **退出退潮板块**
- 关键词热度下降时减仓
- 及时止盈
---
## 实战案例
### 案例12022年4月底部极度悲观
**情绪数据**
```
乐观比例15%
悲观比例68%
热门关键词:暴跌、崩盘、割肉、套牢、熊市
```
**市场表现**
- 上证指数跌至2863点
- 社区一片哀嚎
- "永不回本"成为热词
**反向操作**
- 分批买入指数基金
- 买入超跌优质股
**结果**
- 随后2个月反弹20%+
- 情绪指标成功抄底
---
### 案例22023年9月某科技股讨论量激增
**情绪数据**
```
讨论量从第50名冲到第3名
涨幅连续5天涨停
评论区:全是"十倍股""抄底机会"
```
**反向判断**
- 讨论量爆发 + 已经暴涨
- 典型的追高情绪
- 短期风险较大
**操作**
- 不追高
- 等待回调后再观察
**结果**
- 随后3天连续跌停
- 成功避开风险
---
## API 接口
### POST /api/sentiment/collect
采集社区帖子
**参数**
- `limit`每个来源采集数量10-200
**响应**
```json
{
"ok": true,
"collected": 100,
"saved": 85
}
```
### GET /api/sentiment/index
获取情绪指数
**参数**
- `date`:日期(可选,默认今天)
**响应**
```json
{
"ok": true,
"date": "2024-01-15",
"bullish_count": 320,
"bearish_count": 180,
"neutral_count": 150,
"bullish_ratio": 49.23,
"total_posts": 650,
"top_keywords": [...]
}
```
### GET /api/sentiment/hot_stocks
热议股票排行
**参数**
- `days`统计天数1-7
- `limit`:返回数量(<=50
### GET /api/sentiment/wordcloud
关键词云
**参数**
- `days`统计天数1-30
- `top_n`返回前N个关键词<=100
### GET /api/sentiment/correlation
情绪与股价相关性
**参数**
- `code`:股票代码(必填)
- `days`分析天数20-180
---
## 注意事项
1. **数据时效性**
- 情绪数据需要每日更新
- 建议收盘后采集一次
2. **反向指标的局限性**
- 并非所有股票都是反向指标
- 需要结合基本面和技术面
- 极值信号出现后,反转可能需要时间
3. **样本量要求**
- 至少需要30天以上的数据
- 数据点越多,相关性分析越准确
4. **隐私和合规**
- 仅采集公开信息
- 不存储用户隐私
- 遵守网站使用条款
5. **反爬应对**
- 生产环境需要配置代理
- 控制请求频率
- 模拟真实用户行为
---
## 后续优化
- [ ] 接入更多社区数据源
- [ ] 改进情绪分析算法使用NLP模型
- [ ] 增加舆情热度趋势预警
- [ ] 支持自定义情绪关键词库
- [ ] 增加大V影响力分析
- [ ] 实时情绪监控WebSocket推送
- [ ] 情绪异常检测(突然转向)
- [ ] 历史情绪回测(验证有效性)
---
## 总结
社区情绪监控是一个**反向投资利器**,通过量化散户情绪,帮助投资者:
**识别市场极值点**(极度乐观/悲观)
**发现热点和陷阱**(讨论量激增)
**把握板块轮动**(关键词变化)
**验证反向指标**(情绪与股价相关性)
**核心理念**
当别人恐惧时我贪婪,当别人贪婪时我恐惧。
**适合人群**
- 逆向思维投资者
- 波段操作者
- 价值投资者(择时参考)
**开始使用**
进入"社区情绪" → 点击"采集数据" → 查看情绪指数 → 制定反向策略!