123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778 |
- #file: noinspection SpellCheckingInspection,SpellCheckingInspection,SpellCheckingInspection
- adapter:
- max_error_count: 5
- chinabidding:
- #search_day: '今天'
- search_day: '近一周'
- model_name: 'chinabidding_data_collection_adapter'
- class_name: 'ChinabiddingDataCollectionAdapter'
- batch_save: True
- ccgp:
- #search_day: '今日'
- search_day: '近3日'
- model_name: 'ccgp_data_collection_adapter'
- class_name: 'CcgpDataCollectionAdapter'
- batch_save: False
- default_area: '全国'
- logger:
- file-path: './logs/'
- level: 'debug'
- save:
- collect_data_key: '红外光谱仪,拉曼光谱仪'
- collect_batch_size: 100
- process_batch_size: 1 #AI处理一条插入一条
- attach_file_path: './temp_files/attaches/'
- report_file_path: './temp_files/report/'
- mysql:
- host: 192.168.0.81
- port: 3307
- db: iwb_data_collect_dev
- user: root
- password: Iwb-2024
- charset: utf8mb4
- ai:
- # url: http://192.168.0.109:7580/api/chat
- # model: qwen2.5:7b
- key: sk-febca8fea4a247f096cedeea9f185520
- url: https://dashscope.aliyuncs.com/compatible-mode/v1
- model: qwen-plus
- max_tokens: 1024
- system_prompt: 分析文本,提取出关键信息,并以json格式字符串返回,如果部分信息为空,则该字段返回为空,返回的一定是可以解析的json对象。
- prompt_template_1: 在以上内容中提取信息:编号(no) 、标题(title)、在哪个城市招标(area)、开标的时间(date)、开标的地点(address)、发布时间(release_date)、150字左右的招标条件要求及联系方式等内容摘要(summary),设备(devices)。提取出相关设备的名称信息,多个设备以逗号分割。返回包含no,title,area,date,address,release_date,summary,devices字段的json格式字符串,没有找到或未提供的信息json字段为空,返回的一定是可以解析的json字符串。
- prompt_template_2: 在以上内容中提取信息:编号(no) 、标题(title)、公告时间(date)、标中的总价格,返回带单位的字符串(price)、标中的公司,多个以逗号分割(bidder)、150-300字的标的物说明,标的物价格,公司的明细等内容摘要(summary),设备(devices)。提取出相关设备的名称信息,多个设备以逗号分割。返回包含no,title,date,price,bidder,summary,devices字段的json格式字符串,没有找到或未提供的信息json字段为空,返回的一定是可以解析的json字符串。
- email:
- # smtp_server: smtp.exmail.qq.com
- # smtp_port: 465
- # smtp_user: yueyy@iwbnet.com
- # smtp_password: EXN38AtT97FX635c
- # from_email: yueyy@iwbnet.com
- smtp_server: smtp.163.com
- smtp_port: 465
- smtp_user: yueyunyun88@163.com
- smtp_password: FWRwBZKHTLHjHT5F
- from_email: yueyunyun88@163.com
- error_email: yueyy@iwbnet.com
- job:
- event_id: 1 # 改变这个值,整点会检测重新加载任务
- sleep_interval: 10
- #sleep_interval: 600 #单位:秒 10分钟检查一次
- collect: 06:00,22:00 # 每天采集数据时间
- process: 07:00,10:00 # 每天采集数据时间
- send_email: 8:20,14:00 # 每天发送邮件时间
- send_current_month_report_day: 30 # 每月几号发送本月中标报告
- send_current_month_report_time: 08:20 # 每月几号记点发送本月中标报告
- send_prev_month_report_day: 1 # 每月几号发送上月中标报告
- send_prev_month_report_time: 08:20 # 每月几号记点发送上月中标报告
- clean_data: 00:05 # 每日清理数据时间
- run_now: false
- selenium:
- remote_driver_url: http://127.0.0.1:3534/wd/hub
- clean:
- day: 30 # 清理多少天前的数据 0不清理
- # 下面的没有配置 默认使用 day 的配置
- attach: 30 # 清理多少天前的附件 0不清理
- log: 30 # 清理多少天前的日志 0不清理
- collect_data: 30 # 清理多少天前的采集数据 0不清理
- process_data: 30 # 清理多少天前的处理数据[招标] 0不清理
- process_result_data: 60 # 清理多少天前的处理数据[中标] 0不清理 小于45会强制设为45
- report: 90 # 清理多少天前的报表 0不清理 小于60会强制设为60
|