graphrag 1.2 增量训练文件 注意 settings.yaml 不动,update_index_storage 放开会导致 index 时候出错,所以不能动 建议把训练目录和查询目录分开,保证在新训练时不影响旧数据,避免一些其他影响 操作步骤 1. 复制原有目录文件夹到训练文件夹 123456789101112cp /data/gr_data_search/xxxx/xxx /data/gr_data/xxxx/xxx` 2026-03-28 #graphrag
AI解决不了的问题之 graphrag 使用 openai sdk 出现 "We could not parse the JSON body of your request" 参考资料: https://github.com/microsoft/graphrag/issues/2286 https://community.openai.com/t/solved-error-we-could-not-parse-the-json-body-of-your-request/545372 最近被安排去调查 graphrag index 失败的问题 公司的一个产品在 rag 功 2026-03-27 #graphrag #openai
大模型本身对代码,文档生成修改的影响 大模型本身对代码、文档生成与修改的影响 最近在给自己的 GitBook 项目扩展 skill,用于整理碎片化知识时,尝试一下免费的 qwen-code。原本只是一个简单的自动化改写与补全任务,却因为模型行为的不稳定,引发了一些新的思考。 在实际使用中,qwen-code 内置的 Qwen 3.5 Plus 模型表现出明显的“生成偏差”:中英文混排时频繁插入多余空格,导致输入结构被破坏,进而影响下游 2026-03-19 #LLM #Qwen #vibe coding
由 certbot 切换到 acme.sh, 使用acme.sh进行SSL证书申请 certbot 用来申请SSL证书也是极好的,够用的,acme.sh 很多人推荐,我自己也star了好多年,一直拖着想尝试,最近试了下,用起来还是不错, github地址:https://github.com/acmesh-official/acme.sh nginx配置 123456server { listen 80; server_name api.xxxxx.cn 2025-12-20 #acme.sh #SSL #HTTPS
GPT-5 新特性与应用 gpt-5: https://platform.openai.com/docs/guides/latest-model?reasoning-effort-mode=responses#prompting-guidance https://cookbook.openai.com/examples/gpt-5/gpt-5_new_params_and_tools#4-minimal-reasoning 2025-08-11 #GPT5 #OPENAI #LLM
开发中遇到的一些有意思的字符 1. “Φφ” 这两个字符竟然’相同’ 在文本查找工具中,这两个字符相同,原因:“Φ”.lower()==“φ” 12json.dumps("Φφ")'"\\u03a6\u03c6"' 2. len(“ザ”) == 2 日语中有一些字符看着是一个字,是因为它是两个 Unicode 码点(半角假名+浊音符号) 2025-01-19 #思考
使用python把多个pdf合并为一个pdf文件 安装PyPDF2 1pip install PyPDF2 合并pdf文件 1234567891011121314151617181920from PyPDF2 import PdfMergerdef merge_pdfs(pdf_list, output_file): merger = PdfMerger() try: for pdf in pdf_list: 2025-01-19 #PDF #Python
Python print() 在 Docker 不输出 print 输出有缓冲 解决办法 Dockerfile 1ENV PYTHONUNBUFFERED=1 docker run 1docker run -e PYTHONUNBUFFERED=1 print中的flush=True 1print("start", flush=True) 一个使用python起docker守护进程的命令 123# python3 -m h 2024-10-30 #Python
AWS S3 下载文件翻倍占用内存 在aws doc (https://docs.aws.amazon.com/zh_cn/AmazonS3/latest/userguide/example_s3_Scenario_UsingLargeFiles_section.html)上面找的下载大文件示例,直接粘贴运行,没问题,提交上线 源代码 12345678910111213141516171819// DownloadLargeObje 2024-06-25 #aws #s3
MySQL 读写分离 终于还是来了,读写分离的坑还是被我踩到了,年前接手了同事的一些代码,在上面缝缝补补,最近在自测的时候发现了一个奇怪的事儿,创建的数据推送到消息队列,本地开发环境是没有问题,到了测试环境,消息队的结构数据不正确 排查了一下发现是数据库读写分离的问题 本质就是,插入的数据,需要立马查询出来获取插入的主键ID,为后续业务提供关联 本地开发环境,连接测试数据库延时比较高(100ms往上)复现不到这个问题 2024-04-27 #MySQL