123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117 |
- #file: noinspection SpellCheckingInspection,SpellCheckingInspection,SpellCheckingInspection
- adapter:
- max_retries: 3
- chinabidding:
- #search_day: '今天'
- search_day: '近一周'
- model_name: 'chinabidding_data_collection_adapter'
- class_name: 'ChinabiddingDataCollectionAdapter'
- batch_save: True
- timeout: 30
- ccgp:
- #search_day: '今日'
- search_day: '近3日'
- model_name: 'ccgp_data_collection_adapter'
- class_name: 'CCGPDataCollectionAdapter'
- batch_save: False
- timeout: 30
- default_area: '全国'
- logger:
- file-path: './logs/'
- level: 'debug'
- save:
- collect_data_key: '红外光谱仪,拉曼光谱仪'
- collect_batch_size: 100
- process_batch_size: 1 #AI处理一条插入一条
- attach_file_path: './temp_files/attaches/'
- report_file_path: './temp_files/report/'
- mysql:
- host: 192.168.0.81
- port: 3307
- db: iwb_data_collect_dev
- user: root
- password: Iwb-2024
- charset: utf8mb4
- ai:
- # url: http://192.168.0.109:7580/api/chat
- # model: qwen2.5:7b
- key: sk-febca8fea4a247f096cedeea9f185520
- url: https://dashscope.aliyuncs.com/compatible-mode/v1
- model: qwen-plus
- max_tokens: 1024
- system_prompt: '从给定信息中提取出关键信息,并以给定的类型返回json字符串,如果部分信息为空,则该字段返回为空'
- prompt_template_1: '在以上内容中提取招标信息:
- ```typescript
- export interface Tender { //招标信息
- no: string; // 招标项目编号
- title: string; // 招标公告标题
- province: string; // 招标单位省份
- city: string; // 招标单位城市
- date: string; // 项目开标的时间
- address: string; // 项目开标的地点
- budget: string; // 项目预算金额,单位换成元,没有留空
- release_date: string; // 招标信息的发布时间
- summary: string; // 100字左右的招标条件,联系方式等内容摘要
- devices: string; // 只涉及到光谱仪相关的设备,其他无关设备不需要,多个设备以逗号分割 ,例如 红外光谱仪,拉曼光谱仪等
- }
- ```'
- prompt_template_2: '在以上内容中提取中标信息:
- ```typescript
- export interface Instrument { // 中标仪器信息
- company: string; // 中标单位名称,参与竞标并中标的公司名称
- name: string; // 仪器名称,例如:红外光谱仪
- manufacturer: string; // 仪器厂商,例如:赛默飞、Bruker
- model: string; // 仪器的型号/规格,例如:NIR25S
- quantity: number; // 中标仪器的数量,台数,例如:2
- unit_price: number; // 仪器的单价,单位转换为元,例如:178000.00
- }
- export interface BiddingAcceptance { //中标信息
- no: string; // 项目编号
- title: string; // 中标公告标题
- date: string; // 中标公告时间
- province: string; // 招标单位省份
- city: string; // 招标单位城市
- summary: string; // 公告摘要信息,100字左右
- instruments: Instrument[]; // 中标设备的信息
- }
- ```'
- email:
- # smtp_server: smtp.exmail.qq.com
- # smtp_port: 465
- # smtp_user: yueyy@iwbnet.com
- # smtp_password: EXN38AtT97FX635c
- # from_email: yueyy@iwbnet.com
- smtp_server: smtp.163.com
- smtp_port: 465
- smtp_user: yueyunyun88@163.com
- smtp_password: FWRwBZKHTLHjHT5F
- from_email: yueyunyun88@163.com
- error_email:
- default_email: 349977741@qq.com
- job:
- event_id: 1 # 改变这个值,整点会检测重新加载任务
- sleep_interval: 10
- #sleep_interval: 600 #单位:秒 10分钟检查一次
- collect: 06:00,22:00 # 每天采集数据时间
- process: 07:00,10:00 # 每天采集数据时间
- send_email: 8:20,14:00 # 每天发送邮件时间
- send_current_month_report_day: 30 # 每月几号发送本月中标报告
- send_current_month_report_time: 08:20 # 每月几号记点发送本月中标报告
- send_prev_month_report_day: 1 # 每月几号发送上月中标报告
- send_prev_month_report_time: 08:20 # 每月几号记点发送上月中标报告
- clean_data: 00:05 # 每日清理数据时间
- run_now: false
- selenium:
- remote_driver_url: 'http://127.0.0.1:3534/wd/hub'
- page_load_timeout: 30
- implicit_wait: 10
- headless: true
- clean:
- day: 30 # 清理多少天前的数据 0不清理
- # 下面的没有配置 默认使用 day 的配置
- attach: 30 # 清理多少天前的附件 0不清理
- log: 30 # 清理多少天前的日志 0不清理
- collect_data: 30 # 清理多少天前的采集数据 0不清理
- process_data: 30 # 清理多少天前的处理数据[招标] 0不清理
- process_result_data: 60 # 清理多少天前的处理数据[中标] 0不清理 小于45会强制设为45
- report: 90 # 清理多少天前的报表 0不清理 小于60会强制设为60
|