#采用K-近邻算法,识别图片中的数字内容。
##基本思想说明: ####1 收集大量的数字图片,分类放在0-9文件中作为训练集。 ####2 将图片转换成大小一致的bmp位图。 ####3 将生成的位图转换成纯01文本文件。 ####4 将待计算的图片也如上述转成01文本。 ####5 将上述生成的文本与3中的文本逐个比较距离(即为相应位不相同的数目)。 ####6 取最近距离的k个文件,选择其中结果最多的作为最终的结果。
##各文件夹用途说明: ####original:保存原始的图片,其中包含0-9文件夹。 ####goal:保存图片处理的中间结果(即指定大小的bmp图像),包含0-9文件夹。 ####finalgoal:将goal中的图片转变成对应的01文本文件,包含0-9文件夹。 ####testSet:测试集。 ####web:将含有大量图片的网页本地保存,名为web。 ####webResult:将web文件夹下的jpg图片提取出来。 ####temp:保存待测试的图片的中间临时文件。