{ "cells": [ { "cell_type": "code", "execution_count": 23, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "题号: 000275 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000279 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000337 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000369 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000464 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000467 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000669 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000707 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000728 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000739 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000783 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000804 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000806 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000833 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000864 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000878 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000909 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000957 , 字段: tags 中已添加数据: 抛物线\n", "题号: 000968 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002393 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002395 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002397 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002398 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002400 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002401 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002402 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002403 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002404 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002405 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002406 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002407 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002408 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002409 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002410 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002411 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002412 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002413 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002417 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002418 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002419 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002420 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002421 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002422 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002423 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002424 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002425 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002426 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002427 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002429 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002430 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002431 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002432 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002434 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002436 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002437 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002438 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002439 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002440 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002441 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002445 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002450 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002685 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002689 , 字段: tags 中已添加数据: 抛物线\n", "题号: 002690 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003437 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003438 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003439 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003440 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003441 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003443 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003444 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003446 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003447 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003448 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003449 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003450 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003451 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003599 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003639 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003781 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003795 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003837 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003930 , 字段: tags 中已添加数据: 抛物线\n", "题号: 003945 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004065 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004078 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004141 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004197 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004221 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004225 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004351 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004372 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004495 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004514 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004524 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004550 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004570 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004626 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004639 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004654 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004713 , 字段: tags 中已添加数据: 抛物线\n", "题号: 004764 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008920 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008921 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008922 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008923 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008924 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008925 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008926 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008927 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008928 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008929 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008930 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008931 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008932 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008933 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008934 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008935 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008936 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008937 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008953 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008954 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008955 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008956 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008957 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008960 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008966 , 字段: tags 中已添加数据: 抛物线\n", "题号: 008968 , 字段: tags 中已添加数据: 抛物线\n", "题号: 009077 , 字段: tags 中已添加数据: 抛物线\n", "题号: 009081 , 字段: tags 中已添加数据: 抛物线\n", "题号: 009098 , 字段: tags 中已添加数据: 抛物线\n", "题号: 009099 , 字段: tags 中已添加数据: 抛物线\n", "题号: 009105 , 字段: tags 中已添加数据: 抛物线\n", "题号: 009106 , 字段: tags 中已添加数据: 抛物线\n", "题号: 009110 , 字段: tags 中已添加数据: 抛物线\n", "题号: 009836 , 字段: tags 中已添加数据: 抛物线\n", "题号: 009837 , 字段: tags 中已添加数据: 抛物线\n", "题号: 009838 , 字段: tags 中已添加数据: 抛物线\n", "题号: 009839 , 字段: tags 中已添加数据: 抛物线\n", "题号: 009840 , 字段: tags 中已添加数据: 抛物线\n", "题号: 010682 , 字段: tags 中已添加数据: 抛物线\n", "题号: 010683 , 字段: tags 中已添加数据: 抛物线\n", "题号: 010684 , 字段: tags 中已添加数据: 抛物线\n", "题号: 010685 , 字段: tags 中已添加数据: 抛物线\n", "题号: 010686 , 字段: tags 中已添加数据: 抛物线\n", "题号: 010688 , 字段: tags 中已添加数据: 抛物线\n", "题号: 010689 , 字段: tags 中已添加数据: 抛物线\n", "题号: 010703 , 字段: tags 中已添加数据: 抛物线\n" ] } ], "source": [ "import os,re,json\n", "\n", "\"\"\"---明确数据文件位置---\"\"\"\n", "datafile = \"文本文件/metadata.txt\"\n", "# 双回车分隔,记录内单回车分隔列表,首行为字段名\n", "\"\"\"---文件位置结束---\"\"\"\n", "\n", "def trim(string):\n", " string = re.sub(r\"^[ \\t\\n]*\",\"\",string)\n", " string = re.sub(r\"[ \\t\\n]*$\",\"\",string)\n", " return string\n", "def FloatToInt(string):\n", " f = float(string)\n", " if abs(f-round(f))<0.01:\n", " f = round(f)\n", " return f\n", "\n", "with open(datafile,\"r\",encoding=\"utf8\") as f:\n", " data = f.read()\n", "pos = data.index(\"\\n\")\n", "field = data[:pos].strip()\n", "appending_data = data[pos:]\n", "\n", "with open(r\"../题库0.3/Problems.json\",\"r\",encoding = \"utf8\") as f:\n", " database = f.read()\n", "pro_dict = json.loads(database)\n", "with open(r\"../题库0.3/LessonObj.json\",\"r\",encoding = \"utf8\") as f:\n", " database = f.read()\n", "obj_dict = json.loads(database)\n", "\n", "#该字段列表可能需要更新\n", "fields = [\"content\",\"objs\",\"tags\",\"genre\",\"ans\",\"solution\",\"duration\",\"usages\",\"origin\",\"edit\",\"same\",\"related\",\"remark\",\"space\"]\n", "\n", "if field in fields:\n", " field_type = type(pro_dict[\"000001\"][field])\n", " datalist = [record.strip() for record in appending_data.split(\"\\n\\n\") if len(trim(record)) > 0]\n", " for record in datalist:\n", " id = re.findall(r\"^[\\d]{1,}\",record)[0]\n", " data = record[len(id):].strip()\n", " id = id.zfill(6)\n", " if not id in pro_dict:\n", " print(\"题号:\",id,\"不在数据库中.\")\n", " break\n", " \n", " #字符串类型字段添加数据\n", " elif field_type == str and data in pro_dict[id][field]:\n", " print(\"题号:\",id,\", 字段:\",field,\"中已有该数据:\",data)\n", " elif field_type == str and not data in pro_dict[id][field] and not field == \"ans\" and not field == \"space\":\n", " origin_data = pro_dict[id][field]\n", " new_data = trim(origin_data + \"\\n\" + data)\n", " pro_dict[id][field] = new_data\n", " print(\"题号:\",id,\", 字段:\",field,\"中已添加数据:\",data)\n", " elif field_type == str and not data in pro_dict[id][field] and field == \"ans\" or field == \"space\":\n", " pro_dict[id][field] = data\n", " print(\"题号:\",id,\", 字段:\",field,\"中已修改数据:\",data)\n", " \n", " #数值类型字段添加数据\n", " elif (field_type == int or field_type == float) and abs(float(data) - pro_dict[id][field])<0.01:\n", " print(\"题号:\",id,\", 字段:\",field,\"中已有该数据:\",FloatToInt(data))\n", " elif (field_type == int or field_type == float) and abs(float(data) - pro_dict[id][field])>=0.01:\n", " pro_dict[id][field] = FloatToInt(data)\n", " print(\"题号:\",id,\", 字段:\",field,\"中已修改数据:\",FloatToInt(data))\n", " \n", " #列表类型字段添加数据\n", " elif field_type == list:\n", " cell_data_list = [d.strip() for d in data.split(\"\\n\")]\n", " for cell_data in cell_data_list:\n", " if cell_data in pro_dict[id][field]:\n", " print(\"题号:\",id,\", 字段:\",field,\"中已有该数据:\",cell_data)\n", " elif not field == \"objs\":\n", " pro_dict[id][field].append(cell_data)\n", " print(\"题号:\",id,\", 字段:\",field,\"中已添加数据:\",cell_data)\n", " else:\n", " if not cell_data in obj_dict and not cell_data.upper() == \"KNONE\":\n", " print(\"题号:\",id,\", 字段:\",field,\"目标编号有误:\",cell_data)\n", " else:\n", " pro_dict[id][field].append(cell_data.upper())\n", " print(\"题号:\",id,\", 字段:\",field,\"中已添加数据:\",cell_data.upper())\n", "\n", "with open(r\"../题库0.3/Problems.json\",\"w\",encoding = \"utf8\") as f:\n", " f.write(json.dumps(pro_dict,indent=4,ensure_ascii=False))" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [] } ], "metadata": { "kernelspec": { "display_name": "Python 3.8.8 ('base')", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.8.8" }, "orig_nbformat": 4, "vscode": { "interpreter": { "hash": "d311ffef239beb3b8f3764271728f3972d7b090c974f8e972fcdeedf230299ac" } } }, "nbformat": 4, "nbformat_minor": 2 }