Tag: 数据压缩

编写一个将文本作为input的程序,并生成一个能够再现该文本的程序

最近我遇到了一个很好的问题,这个问题变得简单易懂,很难find解决办法。 问题是: 编写一个程序,从input中读取文本,并在输出上打印其他程序。 如果我们编译并运行打印的程序,它必须输出原文。 input文本应该是相当大的(超过10000个字符)。 唯一的(也是非常强大的)要求是档案的大小(即打印的程序)必须严格小于原始文本的大小。 这使得不可能明显的解决scheme std::string s; /* read the text into s */ std::cout << "#include<iostream> int main () { std::cout<<\"" << s << "\"; }"; 我相信这里会使用一些归档技术。

如何计算位串的近似熵?

有没有一个标准的方法来做到这一点? 谷歌search – “近似熵”位 – 揭示了多篇学术论文,但我只想find一个伪代码块定义任意长度的给定位串的近似熵。 (如果这说起来容易做起来并且取决于应用程序,我的应用程序涉及16,320位encryption数据(密文),但作为一个谜题encryption,并不意味着不可能破解,我想我会先检查熵,但是很难find这样的好的定义,所以这似乎是一个应该在StackOverflow上的问题!从开始去除混合16k随机表示位的想法也是受欢迎的…) 另请参阅以下相关问题: 什么是熵的计算机科学定义?

什么是熵的计算机科学定义?

我最近在我的大学开始了一个关于数据压缩的课程。 然而,我发现“熵”这个术语在计算机科学中应用的含义很模糊。 据我所知,它大致转化为系统或结构的“随机性”。 计算机科学“熵”的正确定义是什么?

如何从zip文件中读取数据,而无需解压整个文件

反正.Net(C#)有没有解压缩完整的文件从压缩文件中提取数据? 简单地说,我可能想从zip文件的开头提取数据(文件),显然这取决于压缩algorithm是否以确定的顺序压缩文件。