Tag: 压缩

创build一个.tar.bz2文件的Linux

在我的Linux机器上,我希望创build一个特定文件夹的.tar.bz2文件。 一旦我将自己置于该文件夹(在terminal中),我将在terminal命令行中input什么内容以将压缩文件夹放在我的机器的主目录中? 假设我在/ home / user /文件夹中。 在文件夹“文件夹”中有几个文件(txt,.c等)。 如何压缩.tar.bz2types的文件夹并将其放在我的/ home目录中? 在/ home / user /文件夹中,我试过sudo tar -cvjSf folder.tar.bz2但是出现错误: 焦油:懦弱地拒绝创build一个空的档案

O(polylog(n))的含义是什么? 特别是,polylog(n)是如何定义的?

简要: 当学术(计算机科学)论文说“O(polylog(n))”时,它们是什么意思? 我没有被我所熟悉的“Big-Oh”符号,而是由函数polylog(n)所迷惑。 他们不是在谈论复杂的分析函数Li s (Z)我认为。 还是他们? 完全不同的东西也许? 更多详情: 主要是为了个人兴趣,我最近一直在研究压缩后缀数组的各种论文,例如向后search的优点 – 有效的二级存储器和压缩后缀数组的分布式实现 。 估计的计算复杂度有时涉及到polylog(n),这是我不熟悉的函数。 Wikipedia给出了polylog s (z)的定义,似乎主要是关于复杂的分析和parsing数论。 我的怀疑是,它与压缩文件中的多词(n)没有关系,尽pipe我很乐意听到其他知识渊博的人。 如果是这样的话,为什么认为省略下标是合理的呢? 我唯一的猜测是,也许O(polylog(n))应该是“渐近于log(n)的多项式函数”。 但这只是一个猜测:我没有证据certificate,这将是一个滥用符号启动。 无论如何,我们将不胜感激一个合理的权威定义。

Python:减less字典的内存使用

我试图加载一些文件到内存中。 这些文件有以下三种格式之一: stringTAB int stringTAB浮动 int TAB float。 事实上,他们是ngram静态文件,以防万一这有助于解决scheme。 例如: i_love TAB 10 love_you TAB 12 目前,我正在做的伪代码是 loadData(file): data = {} for line in file: first, second = line.split('\t') data[first] = int(second) #or float(second) return data 令我惊讶的是,虽然磁盘中的文件总大小约为21 MB,但在装入内存时,这个过程需要120 – 180 MB的内存! (整个python应用程序不会将任何其他数据加载到内存中)。 目前只有不到10个文件,其中大部分文件保持稳定,大约在5万到8万行,除了一个文件目前有数百万行。 所以我想问一个技术/数据结构来减less内存消耗: 任何压缩技术的build议? 如果我仍然使用字典,有什么办法来减less内存? 是否有可能像Java中的Python字典中设置“加载因子”? 如果你有其他一些数据结构,“也愿意交易一些速度来减less内存。 不过,这是一个时间敏感的应用程序,所以一旦用户input他们的查询,我认为花费超过几秒的时间来返回结果是不合理的。 关于这一点,我仍然对谷歌如何快速完成谷歌翻译感到惊讶:他们必须使用大量的技术和大量的服务器function。 非常感谢你。 我期待你的build议。

使用相同的格式缩小video尺寸并缩小帧尺寸

这个问题可能是非常基本的 有没有办法减less有损压缩(WMV,MPEG)格式的帧大小/速率,以获得具有相同格式的较小尺寸的较小video。 有没有开源或专有apis这个?

PHP ZIP文件在飞行中

从服务器上的文件夹压缩2个文件并强制下载最简单的方法是什么? 不要将“zip”保存到服务器。 $zip = new ZipArchive(); //the string "file1" is the name we're assigning the file in the archive $zip->addFile(file_get_contents($filepath1), 'file1'); //file 1 that you want compressed $zip->addFile(file_get_contents($filepath2), 'file2'); //file 2 that you want compressed $zip->addFile(file_get_contents($filepath3), 'file3'); //file 3 that you want compressed echo $zip->file(); //this sends the compressed archive to the output buffer instead […]

在Java中快速压缩?

有一个非常快的Java压缩库吗? 标准的gzip库比我想要的要慢。 我正在寻找类似http://www.oberhumer.com/opensource/lzo/的东西,这是本地Java代码,提供快速压缩和解压缩。 谢谢! 其他一些快速压缩库供将来参考: QuickLZ – C / C#/ Java – GPL或商业http://www.quicklz.com/ libLZF – C – BSD格式的许可证http://oldhome.schmorp.de/marc/liblzf.html FastLZ – C – MIT风格许可证http://fastlz.org/ LZO C – GPL或商业版http://www.oberhumer.com/opensource/lzo/ zlib – C / Java(GZIP和deflate) – 商业友好的许可http://zlib.net/ Hadoop-LZO集成(JNI): http : //github.com/kevinweil/hadoop-lzo Snappy-Java(JNI): https : //github.com/xerial/snappy-java QuickLZ人的基准: http ://www.quicklz.com/bench.html

一个整数序列的最佳压缩algorithm

我有一个大范围的大多数连续的整数,例如1-100,110-160等所有整数都是正数。 什么是最好的algorithm来压缩这个? 我试过放气algorithm,但是这只给了我50%的压缩。 请注意,该algorithm不能是有损的。 所有的数字都是独一无二的,并逐渐增加 另外如果你能指点我这个algorithm的java实现,那将是很棒的。

任何良好的7z公用事业为Mac?

我正在寻找一个好的7zip工具,我可以在MAC上运行(osx 10.7狮子)。 我习惯于运行Windows 7版本,它有一个很好的GUI,与Windows文件pipe理器很好的集成。 有没有这样的事情? 我是OSX的新手,并没有完全弄清楚与GUI工具的文件集成。 我得到了shell的东西,但GUI工具是不错的。

压缩格式,支持档案中的随机访问?

这与前面的问题类似,但是那里的答案不能满足我的需求,而我的问题稍有不同: 我目前使用gzip压缩包含sorting数据的一些非常大的文件。 当文件未被压缩时,二进制search是一种方便有效的方式来支持在sorting后的数据中寻找位置。 但是,当文件被压缩,事情变得棘手。 我最近发现了zlib的Z_FULL_FLUSH选项,可以在压缩过程中使用Z_FULL_FLUSH选项在压缩输出中插入“同步点” inflateSync()然后inflateSync()可以从文件中的各个点开始读取)。 这是好的,虽然我已经有文件将不得不重新join这个function(奇怪的是gzip没有这个选项,但我愿意编写自己的压缩程序,如果我必须)。 从一个来源看来,即使Z_FULL_FLUSH不是一个完美的解决scheme…不仅不是所有的gzip压缩文件都支持,而且在档案中检测同步点的想法可能会产生误报(或者与幻数同步点,或由于Z_SYNC_FLUSH也产生同步点,但它们不能用于随机访问)。 有更好的解决scheme吗? 如果可能的话,我想避免使用辅助文件进行索引,显式的,对准随机访问的默认支持将会有帮助(即使它是大粒度的,就像能够在每个10 MB间隔开始读取一样)。 有没有比gzip更好的支持随机读取的压缩格式? 编辑 :正如我所提到的,我希望在压缩数据中进行二分search。 我不需要寻找一个特定的(未压缩的)位置 – 只是在压缩文件中寻求一些粗略的粒度。 我只是想支持一些东西,如“解压缩大约50%(25%,12.5%等)的数据到这个压缩文件”。

压缩/解压缩文件夹和文件

有谁知道一个很好的方式来压缩或解压缩在C#中的文件和文件夹快速? 处理大文件可能是必要的。