config.yml 4.6 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117
  1. #file: noinspection SpellCheckingInspection,SpellCheckingInspection,SpellCheckingInspection
  2. adapter:
  3. max_retries: 3
  4. chinabidding:
  5. #search_day: '今天'
  6. search_day: '近一周'
  7. model_name: 'chinabidding_data_collection_adapter'
  8. class_name: 'ChinabiddingDataCollectionAdapter'
  9. batch_save: True
  10. timeout: 30
  11. ccgp:
  12. #search_day: '今日'
  13. search_day: '近3日'
  14. model_name: 'ccgp_data_collection_adapter'
  15. class_name: 'CCGPDataCollectionAdapter'
  16. batch_save: False
  17. timeout: 30
  18. default_area: '全国'
  19. logger:
  20. file-path: './logs/'
  21. level: 'debug'
  22. save:
  23. collect_data_key: '红外光谱仪,拉曼光谱仪'
  24. collect_batch_size: 100
  25. process_batch_size: 1 #AI处理一条插入一条
  26. attach_file_path: './temp_files/attaches/'
  27. report_file_path: './temp_files/report/'
  28. mysql:
  29. host: 192.168.0.81
  30. port: 3307
  31. db: iwb_data_collect_dev
  32. user: root
  33. password: Iwb-2024
  34. charset: utf8mb4
  35. ai:
  36. # url: http://192.168.0.109:7580/api/chat
  37. # model: qwen2.5:7b
  38. key: sk-febca8fea4a247f096cedeea9f185520
  39. url: https://dashscope.aliyuncs.com/compatible-mode/v1
  40. model: qwen-plus
  41. max_tokens: 1024
  42. system_prompt: '从给定信息中提取出关键信息,并以给定的类型返回json字符串,如果部分信息为空,则该字段返回为空'
  43. prompt_template_1: '在以上内容中提取招标信息:
  44. ```typescript
  45. export interface Tender { //招标信息
  46. no: string; // 招标项目编号
  47. title: string; // 招标公告标题
  48. province: string; // 招标单位省份
  49. city: string; // 招标单位城市
  50. date: string; // 项目开标的时间
  51. address: string; // 项目开标的地点
  52. budget: string; // 项目预算金额,单位换成元,没有留空
  53. release_date: string; // 招标信息的发布时间
  54. summary: string; // 100字左右的招标条件,联系方式等内容摘要
  55. devices: string; // 只涉及到光谱仪相关的设备,其他无关设备不需要,多个设备以逗号分割 ,例如 红外光谱仪,拉曼光谱仪等
  56. }
  57. ```'
  58. prompt_template_2: '在以上内容中提取中标信息:
  59. ```typescript
  60. export interface Instrument { // 中标仪器信息
  61. company: string; // 中标单位名称,参与竞标并中标的公司名称
  62. name: string; // 仪器名称,例如:红外光谱仪
  63. manufacturer: string; // 仪器厂商,例如:赛默飞、Bruker
  64. model: string; // 仪器的型号/规格,例如:NIR25S
  65. quantity: number; // 中标仪器的数量,台数,例如:2
  66. unit_price: number; // 仪器的单价,单位转换为元,例如:178000.00
  67. }
  68. export interface BiddingAcceptance { //中标信息
  69. no: string; // 项目编号
  70. title: string; // 中标公告标题
  71. date: string; // 中标公告时间
  72. province: string; // 招标单位省份
  73. city: string; // 招标单位城市
  74. summary: string; // 公告摘要信息,100字左右
  75. instruments: Instrument[]; // 中标设备的信息
  76. }
  77. ```'
  78. email:
  79. # smtp_server: smtp.exmail.qq.com
  80. # smtp_port: 465
  81. # smtp_user: yueyy@iwbnet.com
  82. # smtp_password: EXN38AtT97FX635c
  83. # from_email: yueyy@iwbnet.com
  84. smtp_server: smtp.163.com
  85. smtp_port: 465
  86. smtp_user: yueyunyun88@163.com
  87. smtp_password: FWRwBZKHTLHjHT5F
  88. from_email: yueyunyun88@163.com
  89. error_email:
  90. default_email: 349977741@qq.com
  91. job:
  92. event_id: 1 # 改变这个值,整点会检测重新加载任务
  93. sleep_interval: 10
  94. #sleep_interval: 600 #单位:秒 10分钟检查一次
  95. collect: 06:00,22:00 # 每天采集数据时间
  96. process: 07:00,10:00 # 每天采集数据时间
  97. send_email: 8:20,14:00 # 每天发送邮件时间
  98. send_current_month_report_day: 30 # 每月几号发送本月中标报告
  99. send_current_month_report_time: 08:20 # 每月几号记点发送本月中标报告
  100. send_prev_month_report_day: 1 # 每月几号发送上月中标报告
  101. send_prev_month_report_time: 08:20 # 每月几号记点发送上月中标报告
  102. clean_data: 00:05 # 每日清理数据时间
  103. run_now: false
  104. selenium:
  105. remote_driver_url: 'http://127.0.0.1:3534/wd/hub'
  106. page_load_timeout: 30
  107. implicit_wait: 10
  108. headless: true
  109. clean:
  110. day: 30 # 清理多少天前的数据 0不清理
  111. # 下面的没有配置 默认使用 day 的配置
  112. attach: 30 # 清理多少天前的附件 0不清理
  113. log: 30 # 清理多少天前的日志 0不清理
  114. collect_data: 30 # 清理多少天前的采集数据 0不清理
  115. process_data: 30 # 清理多少天前的处理数据[招标] 0不清理
  116. process_result_data: 60 # 清理多少天前的处理数据[中标] 0不清理 小于45会强制设为45
  117. report: 90 # 清理多少天前的报表 0不清理 小于60会强制设为60