Tag: 文本

提取文本OpenCV

我正在尝试在图像中查找文本的边界框,并且正在使用这种方法: // calculate the local variances of the grayscale image Mat t_mean, t_mean_2; Mat grayF; outImg_gray.convertTo(grayF, CV_32F); int winSize = 35; blur(grayF, t_mean, cv::Size(winSize,winSize)); blur(grayF.mul(grayF), t_mean_2, cv::Size(winSize,winSize)); Mat varMat = t_mean_2 – t_mean.mul(t_mean); varMat.convertTo(varMat, CV_8U); // threshold the high variance regions Mat varMatRegions = varMat > 100; 当给这样一个图像: 然后当我显示varMatRegions我得到这个图像: 正如你所看到的,它将左边的文本块和卡片的头部结合起来,对于大多数卡片来说,这种方法效果很好,但是在繁忙的卡片上可能会导致问题。 这些轮廓连接不好的原因是它使得轮廓的边界框几乎占据整个卡。 任何人都可以提出一个不同的方式,我可以找到文本,以确保正确的文本检测? 200分以上的人可以在卡上面找到这两个文字。

MySQL:大VARCHAR与TEXT?

我在MySQL中有一个消息表,它记录用户之间的消息。 除了典型的ID和消息类型(所有整数类型),我需要将实际的消息文本保存为VARCHAR或TEXT。 我设置了3000个字符的前端限制,这意味着这些消息永远不会被插入到数据库比这更长。 使用VARCHAR(3000)还是TEXT有理由吗? 有些东西只是写VARCHAR(3000),感觉有点反直觉。 我已经通过堆栈溢出的其他类似的帖子,但将是很好的获得特定于这种类型的常见信息存储的意见。

如何使用Python搜索和替换文件中的文本?

如何使用Python 3搜索和替换文件中的文本? 这是我的代码: import os import sys import fileinput print ("Text to search for:") textToSearch = input( "> " ) print ("Text to replace it with:") textToReplace = input( "> " ) print ("File to perform Search-Replace on:") fileToSearch = input( "> " ) #fileToSearch = 'D:\dummy1.txt' tempFile = open( fileToSearch, 'r+' ) for line […]

使用Python从HTML文件中提取文本

我想使用Python从HTML文件中提取文本。 如果我从浏览器复制文本并将其粘贴到记事本中,我基本上会得到相同的输出结果。 我想要比使用正则表达式更强大的东西,可能会失败,形成不良的HTML。 我见过很多人推荐美丽的汤,但是我使用它有一些问题。 首先,它收集不需要的文本,例如JavaScript源代码。 而且,它没有解释HTML实体。 例如,我希望“ 在HTML源文件中被转换为撇号,就像我把浏览器内容粘贴到记事本一样。 更新 html2text看起来很有希望。 它正确处理HTML实体并忽略JavaScript。 但是,它并不完全产生纯文本; 它会产生降价,然后不得不变成纯文本。 它没有任何示例或文档,但代码看起来很干净。 相关问题: 过滤掉HTML标签并在Python中解析实体 在Python中将XML / HTML实体转换为Unicode字符串

用特定模式从txt文件创建熊猫数据框

我需要基于以下结构创建基于文本文件的Pandas DataFrame: Alabama[edit] Auburn (Auburn University)[1] Florence (University of North Alabama) Jacksonville (Jacksonville State University)[2] Livingston (University of West Alabama)[2] Montevallo (University of Montevallo)[2] Troy (Troy University)[2] Tuscaloosa (University of Alabama, Stillman College, Shelton State)[3][4] Tuskegee (Tuskegee University)[5] Alaska[edit] Fairbanks (University of Alaska Fairbanks)[2] Arizona[edit] Flagstaff (Northern Arizona University)[6] Tempe (Arizona State University) Tucson (University […]