config.yml 4.0 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778
  1. #file: noinspection SpellCheckingInspection,SpellCheckingInspection,SpellCheckingInspection
  2. adapter:
  3. max_error_count: 5
  4. chinabidding:
  5. #search_day: '今天'
  6. search_day: '近一周'
  7. model_name: 'chinabidding_data_collection_adapter'
  8. class_name: 'ChinabiddingDataCollectionAdapter'
  9. batch_save: True
  10. ccgp:
  11. #search_day: '今日'
  12. search_day: '近3日'
  13. model_name: 'ccgp_data_collection_adapter'
  14. class_name: 'CcgpDataCollectionAdapter'
  15. batch_save: False
  16. default_area: '全国'
  17. logger:
  18. file-path: './logs/'
  19. level: 'debug'
  20. save:
  21. collect_data_key: '红外光谱仪,拉曼光谱仪'
  22. collect_batch_size: 100
  23. process_batch_size: 1 #AI处理一条插入一条
  24. attach_file_path: './temp_files/attaches/'
  25. report_file_path: './temp_files/report/'
  26. mysql:
  27. host: 192.168.0.81
  28. port: 3307
  29. db: iwb_data_collect_dev
  30. user: root
  31. password: Iwb-2024
  32. charset: utf8mb4
  33. ai:
  34. # url: http://192.168.0.109:7580/api/chat
  35. # model: qwen2.5:7b
  36. key: sk-febca8fea4a247f096cedeea9f185520
  37. url: https://dashscope.aliyuncs.com/compatible-mode/v1
  38. model: qwen-plus
  39. max_tokens: 1024
  40. system_prompt: 分析文本,提取出关键信息,并以json格式字符串返回,如果部分信息为空,则该字段返回为空,返回的一定是可以解析的json对象。
  41. prompt_template_1: 在以上内容中提取信息:编号(no) 、标题(title)、在哪个城市招标(area)、开标的时间(date)、开标的地点(address)、发布时间(release_date)、150字左右的招标条件要求及联系方式等内容摘要(summary),设备(devices)。提取出相关设备的名称信息,多个设备以逗号分割。返回包含no,title,area,date,address,release_date,summary,devices字段的json格式字符串,没有找到或未提供的信息json字段为空,返回的一定是可以解析的json字符串。
  42. prompt_template_2: 在以上内容中提取信息:编号(no) 、标题(title)、公告时间(date)、标中的总价格,返回带单位的字符串(price)、标中的公司,多个以逗号分割(bidder)、150-300字的标的物说明,标的物价格,公司的明细等内容摘要(summary),设备(devices)。提取出相关设备的名称信息,多个设备以逗号分割。返回包含no,title,date,price,bidder,summary,devices字段的json格式字符串,没有找到或未提供的信息json字段为空,返回的一定是可以解析的json字符串。
  43. email:
  44. # smtp_server: smtp.exmail.qq.com
  45. # smtp_port: 465
  46. # smtp_user: yueyy@iwbnet.com
  47. # smtp_password: EXN38AtT97FX635c
  48. # from_email: yueyy@iwbnet.com
  49. smtp_server: smtp.163.com
  50. smtp_port: 465
  51. smtp_user: yueyunyun88@163.com
  52. smtp_password: FWRwBZKHTLHjHT5F
  53. from_email: yueyunyun88@163.com
  54. error_email: yueyy@iwbnet.com
  55. job:
  56. event_id: 1 # 改变这个值,整点会检测重新加载任务
  57. sleep_interval: 10
  58. #sleep_interval: 600 #单位:秒 10分钟检查一次
  59. collect: 06:00,22:00 # 每天采集数据时间
  60. process: 07:00,10:00 # 每天采集数据时间
  61. send_email: 8:20,14:00 # 每天发送邮件时间
  62. send_current_month_report_day: 30 # 每月几号发送本月中标报告
  63. send_current_month_report_time: 08:20 # 每月几号记点发送本月中标报告
  64. send_prev_month_report_day: 1 # 每月几号发送上月中标报告
  65. send_prev_month_report_time: 08:20 # 每月几号记点发送上月中标报告
  66. clean_data: 00:05 # 每日清理数据时间
  67. run_now: false
  68. selenium:
  69. remote_driver_url: http://127.0.0.1:3534/wd/hub
  70. clean:
  71. day: 30 # 清理多少天前的数据 0不清理
  72. # 下面的没有配置 默认使用 day 的配置
  73. attach: 30 # 清理多少天前的附件 0不清理
  74. log: 30 # 清理多少天前的日志 0不清理
  75. collect_data: 30 # 清理多少天前的采集数据 0不清理
  76. process_data: 30 # 清理多少天前的处理数据[招标] 0不清理
  77. process_result_data: 60 # 清理多少天前的处理数据[中标] 0不清理 小于45会强制设为45
  78. report: 90 # 清理多少天前的报表 0不清理 小于60会强制设为60