{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 11,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "题号: 021519 , 字段: usages 中已添加数据: 20230224\t2025届高一11班\t1.000\t0.975\t0.700\t0.750\n",
      "题号: 021520 , 字段: usages 中已添加数据: 20230224\t2025届高一11班\t0.875\t0.925\t0.925\t0.950\n",
      "题号: 021521 , 字段: usages 中已添加数据: 20230224\t2025届高一11班\t0.650\n",
      "题号: 021522 , 字段: usages 中已添加数据: 20230224\t2025届高一11班\t0.775\n",
      "题号: 021523 , 字段: usages 中已添加数据: 20230224\t2025届高一11班\t1.000\n",
      "题号: 021524 , 字段: usages 中已添加数据: 20230224\t2025届高一11班\t0.887\n",
      "题号: 021525 , 字段: usages 中已添加数据: 20230224\t2025届高一11班\t0.838\n",
      "题号: 021526 , 字段: usages 中已添加数据: 20230224\t2025届高一11班\t0.900\t0.750\t0.925\n",
      "题号: 021527 , 字段: usages 中已添加数据: 20230224\t2025届高一11班\t0.925\t0.775\t0.825\t0.650\n",
      "题号: 021528 , 字段: usages 中已添加数据: 20230224\t2025届高一11班\t0.975\t0.975\n",
      "题号: 021519 , 字段: usages 中已添加数据: 20230224\t2025届高一12班\t1.000\t0.947\t0.711\t0.789\n",
      "题号: 021520 , 字段: usages 中已添加数据: 20230224\t2025届高一12班\t0.868\t0.974\t0.974\t0.895\n",
      "题号: 021521 , 字段: usages 中已添加数据: 20230224\t2025届高一12班\t0.474\n",
      "题号: 021522 , 字段: usages 中已添加数据: 20230224\t2025届高一12班\t0.789\n",
      "题号: 021523 , 字段: usages 中已添加数据: 20230224\t2025届高一12班\t0.895\n",
      "题号: 021524 , 字段: usages 中已添加数据: 20230224\t2025届高一12班\t0.921\n",
      "题号: 021525 , 字段: usages 中已添加数据: 20230224\t2025届高一12班\t0.882\n",
      "题号: 021526 , 字段: usages 中已添加数据: 20230224\t2025届高一12班\t0.895\t0.842\t0.947\n",
      "题号: 021527 , 字段: usages 中已添加数据: 20230224\t2025届高一12班\t0.921\t0.605\t0.789\t0.605\n",
      "题号: 021528 , 字段: usages 中已添加数据: 20230224\t2025届高一12班\t0.895\t0.829\n",
      "题号: 021519 , 字段: usages 中已添加数据: 20230224\t2025届高一01班\t0.917\t0.861\t0.500\t0.472\n",
      "题号: 021520 , 字段: usages 中已添加数据: 20230224\t2025届高一01班\t0.833\t0.917\t0.889\t0.833\n",
      "题号: 021521 , 字段: usages 中已添加数据: 20230224\t2025届高一01班\t0.417\n",
      "题号: 021522 , 字段: usages 中已添加数据: 20230224\t2025届高一01班\t0.750\n",
      "题号: 021523 , 字段: usages 中已添加数据: 20230224\t2025届高一01班\t0.986\n",
      "题号: 021524 , 字段: usages 中已添加数据: 20230224\t2025届高一01班\t0.708\n",
      "题号: 021525 , 字段: usages 中已添加数据: 20230224\t2025届高一01班\t0.792\n",
      "题号: 021526 , 字段: usages 中已添加数据: 20230224\t2025届高一01班\t0.722\t0.444\t0.639\n",
      "题号: 021527 , 字段: usages 中已添加数据: 20230224\t2025届高一01班\t0.750\t0.583\t0.528\t0.444\n",
      "题号: 021528 , 字段: usages 中已添加数据: 20230224\t2025届高一01班\t0.639\t0.625\n",
      "题号: 021519 , 字段: usages 中已添加数据: 20230224\t2025届高一04班\t0.914\t0.857\t0.571\t0.429\n",
      "题号: 021520 , 字段: usages 中已添加数据: 20230224\t2025届高一04班\t0.857\t0.800\t0.914\t0.743\n",
      "题号: 021521 , 字段: usages 中已添加数据: 20230224\t2025届高一04班\t0.629\n",
      "题号: 021522 , 字段: usages 中已添加数据: 20230224\t2025届高一04班\t0.743\n",
      "题号: 021523 , 字段: usages 中已添加数据: 20230224\t2025届高一04班\t0.829\n",
      "题号: 021524 , 字段: usages 中已添加数据: 20230224\t2025届高一04班\t0.700\n",
      "题号: 021525 , 字段: usages 中已添加数据: 20230224\t2025届高一04班\t0.514\n",
      "题号: 021526 , 字段: usages 中已添加数据: 20230224\t2025届高一04班\t0.686\t0.343\t0.943\n",
      "题号: 021527 , 字段: usages 中已添加数据: 20230224\t2025届高一04班\t0.714\t0.657\t0.514\t0.400\n",
      "题号: 021528 , 字段: usages 中已添加数据: 20230224\t2025届高一04班\t0.543\t0.429\n",
      "题号: 021519 , 字段: usages 中已添加数据: 20230224\t2025届高一05班\t0.974\t0.923\t0.769\t0.718\n",
      "题号: 021520 , 字段: usages 中已添加数据: 20230224\t2025届高一05班\t0.949\t0.872\t0.872\t0.923\n",
      "题号: 021521 , 字段: usages 中已添加数据: 20230224\t2025届高一05班\t0.667\n",
      "题号: 021522 , 字段: usages 中已添加数据: 20230224\t2025届高一05班\t0.846\n",
      "题号: 021523 , 字段: usages 中已添加数据: 20230224\t2025届高一05班\t0.795\n",
      "题号: 021524 , 字段: usages 中已添加数据: 20230224\t2025届高一05班\t0.744\n",
      "题号: 021525 , 字段: usages 中已添加数据: 20230224\t2025届高一05班\t0.692\n",
      "题号: 021526 , 字段: usages 中已添加数据: 20230224\t2025届高一05班\t0.744\t0.615\t0.923\n",
      "题号: 021527 , 字段: usages 中已添加数据: 20230224\t2025届高一05班\t0.692\t0.718\t0.590\t0.410\n",
      "题号: 021528 , 字段: usages 中已添加数据: 20230224\t2025届高一05班\t0.577\t0.423\n",
      "题号: 021519 , 字段: usages 中已添加数据: 20230224\t2025届高一06班\t0.879\t0.788\t0.394\t0.485\n",
      "题号: 021520 , 字段: usages 中已添加数据: 20230224\t2025届高一06班\t0.849\t0.879\t0.879\t0.727\n",
      "题号: 021521 , 字段: usages 中已添加数据: 20230224\t2025届高一06班\t0.697\n",
      "题号: 021522 , 字段: usages 中已添加数据: 20230224\t2025届高一06班\t0.606\n",
      "题号: 021523 , 字段: usages 中已添加数据: 20230224\t2025届高一06班\t0.864\n",
      "题号: 021524 , 字段: usages 中已添加数据: 20230224\t2025届高一06班\t0.803\n",
      "题号: 021525 , 字段: usages 中已添加数据: 20230224\t2025届高一06班\t0.742\n",
      "题号: 021526 , 字段: usages 中已添加数据: 20230224\t2025届高一06班\t0.667\t0.455\t0.879\n",
      "题号: 021527 , 字段: usages 中已添加数据: 20230224\t2025届高一06班\t0.727\t0.576\t0.424\t0.273\n",
      "题号: 021528 , 字段: usages 中已添加数据: 20230224\t2025届高一06班\t0.667\t0.515\n",
      "题号: 021519 , 字段: usages 中已添加数据: 20230224\t2025届高一08班\t1.000\t0.939\t0.576\t0.424\n",
      "题号: 021520 , 字段: usages 中已添加数据: 20230224\t2025届高一08班\t0.697\t0.849\t0.849\t0.788\n",
      "题号: 021521 , 字段: usages 中已添加数据: 20230224\t2025届高一08班\t0.515\n",
      "题号: 021522 , 字段: usages 中已添加数据: 20230224\t2025届高一08班\t0.758\n",
      "题号: 021523 , 字段: usages 中已添加数据: 20230224\t2025届高一08班\t0.849\n",
      "题号: 021524 , 字段: usages 中已添加数据: 20230224\t2025届高一08班\t0.727\n",
      "题号: 021525 , 字段: usages 中已添加数据: 20230224\t2025届高一08班\t0.515\n",
      "题号: 021526 , 字段: usages 中已添加数据: 20230224\t2025届高一08班\t0.818\t0.576\t0.939\n",
      "题号: 021527 , 字段: usages 中已添加数据: 20230224\t2025届高一08班\t0.939\t0.636\t0.485\t0.515\n",
      "题号: 021528 , 字段: usages 中已添加数据: 20230224\t2025届高一08班\t0.773\t0.530\n",
      "题号: 021519 , 字段: usages 中已添加数据: 20230224\t2025届高一09班\t1.000\t0.892\t0.676\t0.595\n",
      "题号: 021520 , 字段: usages 中已添加数据: 20230224\t2025届高一09班\t0.919\t0.811\t0.973\t0.784\n",
      "题号: 021521 , 字段: usages 中已添加数据: 20230224\t2025届高一09班\t0.622\n",
      "题号: 021522 , 字段: usages 中已添加数据: 20230224\t2025届高一09班\t0.649\n",
      "题号: 021523 , 字段: usages 中已添加数据: 20230224\t2025届高一09班\t0.811\n",
      "题号: 021524 , 字段: usages 中已添加数据: 20230224\t2025届高一09班\t0.676\n",
      "题号: 021525 , 字段: usages 中已添加数据: 20230224\t2025届高一09班\t0.703\n",
      "题号: 021526 , 字段: usages 中已添加数据: 20230224\t2025届高一09班\t0.892\t0.622\t0.919\n",
      "题号: 021527 , 字段: usages 中已添加数据: 20230224\t2025届高一09班\t0.973\t0.703\t0.540\t0.568\n",
      "题号: 021528 , 字段: usages 中已添加数据: 20230224\t2025届高一09班\t0.878\t0.716\n"
     ]
    }
   ],
   "source": [
    "import os,re,json\n",
    "\n",
    "\"\"\"---明确数据文件位置---\"\"\"\n",
    "datafile = \"文本文件/metadata.txt\"\n",
    "# 双回车分隔，记录内单回车分隔列表，首行为字段名\n",
    "\"\"\"---文件位置结束---\"\"\"\n",
    "\n",
    "def trim(string):\n",
    "    string = re.sub(r\"^[ \\t\\n]*\",\"\",string)\n",
    "    string = re.sub(r\"[ \\t\\n]*$\",\"\",string)\n",
    "    return string\n",
    "def FloatToInt(string):\n",
    "    f = float(string)\n",
    "    if abs(f-round(f))<0.01:\n",
    "        f = round(f)\n",
    "    return f\n",
    "\n",
    "with open(datafile,\"r\",encoding=\"utf8\") as f:\n",
    "    data = f.read().strip()\n",
    "pos = data.index(\"\\n\")\n",
    "field = data[:pos].strip()\n",
    "appending_data = data[pos:]\n",
    "\n",
    "with open(r\"../题库0.3/Problems.json\",\"r\",encoding = \"utf8\") as f:\n",
    "    database = f.read()\n",
    "pro_dict = json.loads(database)\n",
    "with open(r\"../题库0.3/LessonObj.json\",\"r\",encoding = \"utf8\") as f:\n",
    "    database = f.read()\n",
    "obj_dict = json.loads(database)\n",
    "\n",
    "#该字段列表可能需要更新\n",
    "fields = [\"content\",\"objs\",\"tags\",\"genre\",\"ans\",\"solution\",\"duration\",\"usages\",\"origin\",\"edit\",\"same\",\"related\",\"remark\",\"space\"]\n",
    "\n",
    "if field in fields:\n",
    "    field_type = type(pro_dict[\"000001\"][field])\n",
    "    datalist = [record.strip() for record in appending_data.split(\"\\n\\n\") if len(trim(record)) > 0]\n",
    "    for record in datalist:\n",
    "        id = re.findall(r\"^[\\d]{1,}\",record)[0]\n",
    "        data = record[len(id):].strip()\n",
    "        id = id.zfill(6)\n",
    "        if not id in pro_dict:\n",
    "            print(\"题号:\",id,\"不在数据库中.\")\n",
    "            break\n",
    "        \n",
    "        #字符串类型字段添加数据\n",
    "        elif field_type == str and data in pro_dict[id][field]:\n",
    "            print(\"题号:\",id,\", 字段:\",field,\"中已有该数据:\",data)\n",
    "        elif field_type == str and not data in pro_dict[id][field] and not field == \"ans\" and not field == \"space\":\n",
    "            origin_data = pro_dict[id][field]\n",
    "            new_data = trim(origin_data + \"\\n\" + data)\n",
    "            pro_dict[id][field] = new_data\n",
    "            print(\"题号:\",id,\", 字段:\",field,\"中已添加数据:\",data)\n",
    "        elif field_type == str and not data in pro_dict[id][field] and field == \"ans\" or field == \"space\":\n",
    "            pro_dict[id][field] = data\n",
    "            print(\"题号:\",id,\", 字段:\",field,\"中已修改数据:\",data)\n",
    "        \n",
    "        #数值类型字段添加数据\n",
    "        elif (field_type == int or field_type == float) and abs(float(data) - pro_dict[id][field])<0.01:\n",
    "            print(\"题号:\",id,\", 字段:\",field,\"中已有该数据:\",FloatToInt(data))\n",
    "        elif (field_type == int or field_type == float) and abs(float(data) - pro_dict[id][field])>=0.01:\n",
    "            pro_dict[id][field] = FloatToInt(data)\n",
    "            print(\"题号:\",id,\", 字段:\",field,\"中已修改数据:\",FloatToInt(data))\n",
    "        \n",
    "        #列表类型字段添加数据\n",
    "        elif field_type == list:\n",
    "            cell_data_list = [d.strip() for d in data.split(\"\\n\")]\n",
    "            for cell_data in cell_data_list:\n",
    "                if cell_data in pro_dict[id][field]:\n",
    "                    print(\"题号:\",id,\", 字段:\",field,\"中已有该数据:\",cell_data)\n",
    "                elif not field == \"objs\":\n",
    "                    pro_dict[id][field].append(cell_data)\n",
    "                    print(\"题号:\",id,\", 字段:\",field,\"中已添加数据:\",cell_data)\n",
    "                else:\n",
    "                    if not cell_data in obj_dict and not cell_data.upper() == \"KNONE\":\n",
    "                        print(\"题号:\",id,\", 字段:\",field,\"目标编号有误:\",cell_data)\n",
    "                    else:\n",
    "                        pro_dict[id][field].append(cell_data.upper())\n",
    "                        print(\"题号:\",id,\", 字段:\",field,\"中已添加数据:\",cell_data.upper())\n",
    "\n",
    "with open(r\"../题库0.3/Problems.json\",\"w\",encoding = \"utf8\") as f:\n",
    "    f.write(json.dumps(pro_dict,indent=4,ensure_ascii=False))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "mathdept",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.9.15"
  },
  "orig_nbformat": 4,
  "vscode": {
   "interpreter": {
    "hash": "ff3c292c316ba85de6f1ad75f19c731e79d694e741b6f515ec18f14996fe48dc"
   }
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}