This repository has been archived on 2024-06-23. You can view files and clone it, but cannot push or open issues or pull requests.
mathdeptv2/工具/批量添加题库字段数据.ipynb

220 lines
14 KiB
Plaintext

{
"cells": [
{
"cell_type": "code",
"execution_count": 7,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"题号: 013217 , 字段: ans 中已修改数据: $\\dfrac 16$\n",
"题号: 014083 , 字段: ans 中已修改数据: $\\dfrac{27}{100}$\n",
"题号: 014090 , 字段: ans 中已修改数据: $\\dfrac 13$\n",
"题号: 014577 , 字段: ans 中已修改数据: $\\dfrac{13}{21}$\n",
"题号: 014585 , 字段: ans 中已修改数据: $\\dfrac{6}{25}$\n",
"题号: 014591 , 字段: ans 中已修改数据: $\\dfrac{9}{10}$\n",
"题号: 014593 , 字段: ans 中已修改数据: $\\dfrac 13$\n",
"题号: 014601 , 字段: ans 中已修改数据: $\\dfrac 2{55}$\n",
"题号: 014599 , 字段: ans 中已修改数据: $\\dfrac{41}{70}$\n",
"题号: 014603 , 字段: ans 中已修改数据: $(0,0.7)$\n",
"题号: 014598 , 字段: ans 中已修改数据: $9$\n",
"题号: 014594 , 字段: ans 中已修改数据: $0.14$\n",
"题号: 014094 , 字段: ans 中已修改数据: (1) $\\dfrac 15$; (2) $\\dfrac 35$; (3) $\\dfrac 9{10}$\n",
"题号: 014597 , 字段: ans 中已修改数据: (1) $0.6$; (2) $X\\sim \\begin{pmatrix}0 & 10 & 20 & 30 \\\\ 0.16 & 0.44 & 0.34 & 0.06\\end{pmatrix}$, $E[X]=13$\n",
"题号: 014608 , 字段: ans 中已修改数据: $P_n=\\dfrac 12(1+(-\\dfrac 13)^{n-1})$\n",
"题号: 014081 , 字段: ans 中已修改数据: $\\dfrac 45$\n",
"题号: 014086 , 字段: ans 中已修改数据: $\\dfrac{9}{50}$\n",
"题号: 014091 , 字段: ans 中已修改数据: $\\dfrac{31}{120}$\n",
"题号: 014580 , 字段: ans 中已修改数据: $\\dfrac 12$\n",
"题号: 013234 , 字段: ans 中已修改数据: $\\dfrac{1}{168}$\n",
"题号: 014592 , 字段: ans 中已修改数据: $\\dfrac{95}{99}$\n",
"题号: 014602 , 字段: ans 中已修改数据: $\\dfrac 49$\n",
"题号: 014605 , 字段: ans 中已修改数据: $0.66$\n",
"题号: 014606 , 字段: ans 中已修改数据: $\\dfrac 43$\n",
"题号: 014604 , 字段: ans 中已修改数据: $0.1$\n",
"题号: 014607 , 字段: ans 中已修改数据: $5$\n",
"题号: 014595 , 字段: ans 中已修改数据: (1) $\\dfrac 3{16}$; (2) $\\dfrac 12$\n",
"题号: 014596 , 字段: ans 中已修改数据: $0.03$\n",
"题号: 014600 , 字段: ans 中已修改数据: (1) $\\dfrac{12}{25}$; (2) $\\dfrac 9{25}$\n",
"题号: 013220 , 字段: ans 中已修改数据: $m>n$\n",
"题号: 014092 , 字段: ans 中已修改数据: $63$\n",
"题号: 014629 , 字段: ans 中已修改数据: $447$\n",
"题号: 014631 , 字段: ans 中已修改数据: B\n",
"题号: 014632 , 字段: ans 中已修改数据: 无关\n",
"题号: 014635 , 字段: ans 中已修改数据: \\textcircled{1}\\textcircled{2}\\textcircled{4}\n",
"题号: 014641 , 字段: ans 中已修改数据: $7$\n",
"题号: 014637 , 字段: ans 中已修改数据: (1) $a=0.3$, $b=0.1$; (2) 甲离子残留百分比的平均值约为$4.05$($\\%$), 乙离子残留百分比的平均值约为$6$($\\%$)\n",
"题号: 014638 , 字段: ans 中已修改数据: (1) 图略, 有明显的正相关关系; (2) $r\\approx 0.97$, 相关性明显, 为正相关; (3) 拟合直线为$y=1.0173x+0.1909$, 当产品加工前含水率为$19\\%$时, 加工后含水率估计为$19.5\\%$\n",
"题号: 014634 , 字段: ans 中已修改数据: (1) 图略; (2) \\begin{tabular}{|c||c|c||c|c|c|}\n",
"\\hline\n",
"学历 & 均值 & 中位数 & 极差 & 方差 & 标准差 \\\\ \\hline\n",
"专科 & $14.13$ & $14.66$ & $9.94$ & $4.52$ & $2.13$ \\\\ \\hline\n",
"本科 & $20.05$ & $19.75$ & $26.73$ & $45.84$ & $6.77$ \\\\ \\hline\n",
"研究生 & $5.20$ & $4.54$ & $17.39$ & $14.03$ & $3.75$ \\\\ \\hline\n",
"\\end{tabular} (3) 专科与本科的相关系数约为$0.68$, 有较强的正相关性; 专科与研究生的相关系数约为$0.41$, 有较弱的正相关性; 本科与研究生的相关性约为$0.90$, 有很强的正相关性\n",
"题号: 014633 , 字段: ans 中已修改数据: (1) 女性样本离散程度较高, 男性样本数据的第$80$百分位数为$2.7$($\\%$); (2) $a=8$, 平均数约为$6.3$, 方差约为$41.3$; (3) 男性$2625$人, 女性$2375$人\n",
"题号: 013235 , 字段: ans 中已修改数据: \\textcircled{3}\n",
"题号: 013218 , 字段: ans 中已修改数据: $50$\n",
"题号: 013237 , 字段: ans 中已修改数据: $8$或$10$或$11$\n",
"题号: 014640 , 字段: ans 中已修改数据: \\textcircled{1}\\textcircled{4}\n",
"题号: 014642 , 字段: ans 中已修改数据: $27.6\\times 10^3$\n",
"题号: 014643 , 字段: ans 中已修改数据: $3$; $30$\n",
"题号: 014636 , 字段: ans 中已修改数据: C\n",
"题号: 014088 , 字段: ans 中已修改数据: B\n",
"题号: 014085 , 字段: ans 中已修改数据: (1) $400$; (2) $4$; (3) $0.7$\n",
"题号: 014644 , 字段: ans 中已修改数据: (1) 横截面积的平均值约为$0.06\\text{m}^2$; 材积量的平均值约为$0.39\\text{m}^3$; (2) $r\\approx 0.97$; (3) 比例系数的估计值$\\hat{k}=\\dfrac{\\displaystyle\\sum_{i=1}^{10}x_iy_i}{\\displaystyle\\sum_{i=1}^{10}x_i^2}$, 约为$1210.9\\text{m}^3$\n",
"题号: 014645 , 字段: ans 中已修改数据: (1) $\\chi^2=24$, 认为有关; (2) 证明略; (3) $R$的估计值为$6$\n",
"题号: 014646 , 字段: ans 中已修改数据: (1) $X\\sim \\begin{pmatrix} 155 & 165 & 175 & 185 & 195 & 205 \\\\ 0.22 & 0.27 & 0.25 & 0.15 & 0.1 & 0.01\\end{pmatrix}$, $E[X]=171.7$($\\text{cm}$); (2) $0.0312$; (3) $27.25$\n",
"题号: 012942 , 字段: ans 中已修改数据: $\\begin{cases} 2, & n=1, \\\\ 2^{n-1} & n\\ge 2\\end{cases}$\n",
"题号: 012941 , 字段: ans 中已修改数据: $\\dfrac{2}{19}$\n",
"题号: 012976 , 字段: ans 中已修改数据: $2^{\\frac{n(n-1)}{2}}$\n",
"题号: 012923 , 字段: ans 中已修改数据: $3018$\n",
"题号: 013002 , 字段: ans 中已修改数据: $2999$\n",
"题号: 014550 , 字段: ans 中已修改数据: $(-\\infty,3)$\n",
"题号: 012966 , 字段: ans 中已修改数据: $8$\n",
"题号: 013005 , 字段: ans 中已修改数据: $2^{n+1}$\n",
"题号: 013935 , 字段: ans 中已修改数据: $\\dfrac{2\\sqrt{3}}3$\n",
"题号: 012978 , 字段: ans 中已修改数据: $33$\n",
"题号: 012932 , 字段: ans 中已修改数据: $\\dfrac{n}{n+1}$\n",
"题号: 012947 , 字段: ans 中已修改数据: $\\begin{cases} 2, & n=1, \\\\ -\\dfrac{1}{3^{n-1}} & n\\ge 2\\end{cases}$\n",
"题号: 012971 , 字段: ans 中已修改数据: (1) 最大项为$a_{10}-b_{10}=8976$; (2) $\\{1,2,3,\\cdots,13\\}$\n",
"题号: 013960 , 字段: ans 中已修改数据: (1) $a_n=2^n+1$; (2) 证明略; (3) 证明略\n",
"题号: 013000 , 字段: ans 中已修改数据: $\\dfrac 34-\\dfrac{2n+3}{2(n^2+3n+2)}$\n",
"题号: 012956 , 字段: ans 中已修改数据: $\\begin{cases} 4, & n=1, \\\\ 2 & n\\ge 2\\end{cases}$\n",
"题号: 014553 , 字段: ans 中已修改数据: $3$\n",
"题号: 012959 , 字段: ans 中已修改数据: $\\begin{cases} 1, & n=1, \\\\ 2^{n-2} & n\\ge 2\\end{cases}$\n",
"题号: 012977 , 字段: ans 中已修改数据: $0$; $-\\dfrac{63}{256}$\n",
"题号: 012982 , 字段: ans 中已修改数据: $4$或$5$或$32$\n",
"题号: 013955 , 字段: ans 中已修改数据: $9$\n",
"题号: 013944 , 字段: ans 中已修改数据: $(-\\infty,-2]\\cup [2,+\\infty)$\n",
"题号: 012936 , 字段: ans 中已修改数据: $1830$\n",
"题号: 014560 , 字段: ans 中已修改数据: B\n",
"题号: 013006 , 字段: ans 中已修改数据: (1) $\\{f(n)\\}$是严格增数列, 证明略; (2) $(-\\infty,0)\\cup (0,1)$\n",
"题号: 012983 , 字段: ans 中已修改数据: (1) $(a_1,a_2)=(0,0)$或$(1-\\sqrt{2},2-\\sqrt{2})$或$(1+\\sqrt{2},2+\\sqrt{2})$; (2) 当$n=7$时$T_n$最大, $T_7=7-\\dfrac{21}{2}\\lg 2$\n",
"题号: 012938 , 字段: ans 中已修改数据: (1) $b_n=\\begin{cases} 2^{\\frac 32 n}, & n=2k, \\\\ 2^{\\frac{3n-1}2} & n=2k-1\\end{cases}$($k$为正整数); (2) $S_n=\\begin{cases} \\dfrac{10}{7}\\cdot 2^{\\frac 32 n}-\\dfrac{10}{7}, & n=2k, \\\\ \\dfrac{3}{7}\\cdot 2^{\\frac{3n-1}2}-\\dfrac{10}{7} & n=2k-1\\end{cases}$($k$为正整数)\n"
]
}
],
"source": [
"import os,re,json\n",
"\n",
"\"\"\"---明确数据文件位置---\"\"\"\n",
"datafile = \"文本文件/metadata.txt\"\n",
"# 双回车分隔,记录内单回车分隔列表,首行为字段名\n",
"\"\"\"---文件位置结束---\"\"\"\n",
"\n",
"def trim(string):\n",
" string = re.sub(r\"^[ \\t\\n]*\",\"\",string)\n",
" string = re.sub(r\"[ \\t\\n]*$\",\"\",string)\n",
" return string\n",
"def FloatToInt(string):\n",
" f = float(string)\n",
" if abs(f-round(f))<0.01:\n",
" f = round(f)\n",
" return f\n",
"\n",
"with open(datafile,\"r\",encoding=\"utf8\") as f:\n",
" data = f.read().strip()\n",
"pos = data.index(\"\\n\")\n",
"field = data[:pos].strip()\n",
"appending_data = data[pos:]\n",
"\n",
"with open(r\"../题库0.3/Problems.json\",\"r\",encoding = \"utf8\") as f:\n",
" database = f.read()\n",
"pro_dict = json.loads(database)\n",
"with open(r\"../题库0.3/LessonObj.json\",\"r\",encoding = \"utf8\") as f:\n",
" database = f.read()\n",
"obj_dict = json.loads(database)\n",
"\n",
"#该字段列表可能需要更新\n",
"fields = [\"content\",\"objs\",\"tags\",\"genre\",\"ans\",\"solution\",\"duration\",\"usages\",\"origin\",\"edit\",\"same\",\"related\",\"remark\",\"space\"]\n",
"\n",
"if field in fields:\n",
" field_type = type(pro_dict[\"000001\"][field])\n",
" datalist = [record.strip() for record in appending_data.split(\"\\n\\n\") if len(trim(record)) > 0]\n",
" for record in datalist:\n",
" id = re.findall(r\"^[\\d]{1,}\",record)[0]\n",
" data = record[len(id):].strip()\n",
" id = id.zfill(6)\n",
" if not id in pro_dict:\n",
" print(\"题号:\",id,\"不在数据库中.\")\n",
" break\n",
" \n",
" #字符串类型字段添加数据\n",
" elif field_type == str and data in pro_dict[id][field]:\n",
" print(\"题号:\",id,\", 字段:\",field,\"中已有该数据:\",data)\n",
" elif field_type == str and not data in pro_dict[id][field] and not field == \"ans\" and not field == \"space\":\n",
" origin_data = pro_dict[id][field]\n",
" new_data = trim(origin_data + \"\\n\" + data)\n",
" pro_dict[id][field] = new_data\n",
" print(\"题号:\",id,\", 字段:\",field,\"中已添加数据:\",data)\n",
" elif field_type == str and not data in pro_dict[id][field] and field == \"ans\" or field == \"space\":\n",
" pro_dict[id][field] = data\n",
" print(\"题号:\",id,\", 字段:\",field,\"中已修改数据:\",data)\n",
" \n",
" #数值类型字段添加数据\n",
" elif (field_type == int or field_type == float) and abs(float(data) - pro_dict[id][field])<0.01:\n",
" print(\"题号:\",id,\", 字段:\",field,\"中已有该数据:\",FloatToInt(data))\n",
" elif (field_type == int or field_type == float) and abs(float(data) - pro_dict[id][field])>=0.01:\n",
" pro_dict[id][field] = FloatToInt(data)\n",
" print(\"题号:\",id,\", 字段:\",field,\"中已修改数据:\",FloatToInt(data))\n",
" \n",
" #列表类型字段添加数据\n",
" elif field_type == list:\n",
" cell_data_list = [d.strip() for d in data.split(\"\\n\")]\n",
" for cell_data in cell_data_list:\n",
" if cell_data in pro_dict[id][field]:\n",
" print(\"题号:\",id,\", 字段:\",field,\"中已有该数据:\",cell_data)\n",
" elif not field == \"objs\":\n",
" pro_dict[id][field].append(cell_data)\n",
" print(\"题号:\",id,\", 字段:\",field,\"中已添加数据:\",cell_data)\n",
" else:\n",
" if not cell_data in obj_dict and not cell_data.upper() == \"KNONE\":\n",
" print(\"题号:\",id,\", 字段:\",field,\"目标编号有误:\",cell_data)\n",
" else:\n",
" pro_dict[id][field].append(cell_data.upper())\n",
" print(\"题号:\",id,\", 字段:\",field,\"中已添加数据:\",cell_data.upper())\n",
"\n",
"with open(r\"../题库0.3/Problems.json\",\"w\",encoding = \"utf8\") as f:\n",
" f.write(json.dumps(pro_dict,indent=4,ensure_ascii=False))"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
}
],
"metadata": {
"kernelspec": {
"display_name": "pythontest",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.9.15"
},
"orig_nbformat": 4,
"vscode": {
"interpreter": {
"hash": "91219a98e0e9be72efb992f647fe78b593124968b75db0b865552d6787c8db93"
}
}
},
"nbformat": 4,
"nbformat_minor": 2
}