Tag: 优化

场与财产。 性能优化

请注意这个问题只与性能有关。 让我们跳过devise指南,哲学,兼容性,可移植性以及任何与纯粹性能无关的东西。 谢谢。 现在的问题。 我一直认为,因为C#getters / setter实际上是伪装的方法,所以阅读public字段必须比调用getter更快。 所以要确保我做了一个testing(下面的代码)。 但是, 如果您在Visual Studio中运行该testing,则此testing只会产生预期的结果(即字段比34%的获得者更快 )。 一旦你从命令行运行它显示几乎相同的时间… 唯一的解释可能是CLR做了额外的优化(纠正我,如果我在这里是错的)。 我不相信在实际的应用中,这些属性以更复杂的方式被使用,它们将以相同的方式被优化。 请帮助我certificate或反驳现实生活中属性比田野慢的观点。 问题是 – 我应该如何修改testing类来使CLR更改行为,使公共领域超越获取者。 或者告诉我,没有内部逻辑的任何属性将会像字段一样执行(至less在getter上) 编辑:我只谈论版本x64构build。 using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Diagnostics; using System.Runtime.InteropServices; namespace PropertyVsField { class Program { static int LEN = 20000000; static void Main(string[] args) { List<A> a = new List<A>(LEN); List<B> […]

有多less个GCC优化级别?

有多less个GCC优化级别? 我试过gcc -O1,gcc -O2,gcc -O3和gcc -O4 如果我使用一个非常大的数字,它将不起作用。 不过,我已经尝试过了 gcc -O100 并编译。 有多less优化级别?

如何处理Java BigDecimal的性能?

我写生活的货币交易应用程序,所以我不得不使用货币值(这是一个遗憾的是,Java仍然没有十进制浮点types,没有任何支持任意精度的货币计算)。 “使用BigDecimal!” – 你可能会说。 我做。 但是现在我有一些代码,性能是一个问题,BigDecimal比double基元慢1000倍以上(!)。 计算非常简单:系统所做的是多次计算a = (1/b) * c (其中a , b和c是定点值)。 但问题在于(1/b) 。 由于没有固定点,我不能使用定点算术。 BigDecimal result = a.multiply(BigDecimal.ONE.divide(b).multiply(c)不仅丑陋,而且缓慢。 我可以用什么来取代BigDecimal? 我需要至less10倍的性能提升。 我发现其他优秀的JScience库具有任意精度算术,但它甚至比BigDecimal慢。 有什么build议么?

为什么对这个Scala代码做一个小小的改变,对性能造成如此巨大的影响?

我正在运行一个32位的Debian 6.0 (Squeeze)系统(一个2.5 GHz的Core 2 CPU),sun-java6 6.24-1,但使用了Wheezy的Scala 2.8.1软件包。 这个编译scalac -optimise代码需要30多秒的时间才能运行: object Performance { import scala.annotation.tailrec @tailrec def gcd(x:Int,y:Int):Int = { if (x == 0) y else gcd(y%x,x) } val p = 1009 val q = 3643 val t = (p-1)*(q-1) val es = (2 until t).filter(gcd(_,t) == 1) def main(args:Array[String]) { println(es.length) } } 但是,如果我把这个小小的变化移动到main的范围内,那么它会在1秒内运行,这更像是我希望看到的,与相当于C […]

优化Python字典访问代码

题: 我已经将我的Python程序简介为死亡,并且有一个函数正在放慢速度。 它大量使用Python字典,所以我可能没有以最好的方式使用它们。 如果我不能更快地运行它,我将不得不用C ++重新编写它,那么有没有人可以帮我在Python中进行优化? 我希望我已经给出了正确的解释,并且可以对我的代码有所了解。 在此先感谢您的帮助。 我的代码: 这是有问题的函数,使用line_profiler和kernprof进行分析 。 我正在运行Python 2.7 特别是像363,389和405行这样的事情让我感到困惑,其中一个if语句与两个variables的比较似乎花费了过多的时间。 我已经考虑使用NumPy (因为它稀疏matrix),但我不认为这是适当的,因为:(1)我没有索引我的matrix使用整数(我使用的对象实例); 和(2)我没有在matrix中存储简单的数据types(我正在存储一个float和一个对象实例的元组)。 但我很乐意被NumPy说服。 如果有人知道NumPy的稀疏matrix性能与Python的哈希表,我会感兴趣。 对不起,我还没有给出一个简单的例子,你可以运行,但是这个函数绑定在一个更大的项目中,我不能解决如何设置一个简单的例子来testing它,而不会给你一半的代码基础! Timer unit: 3.33366e-10 s File: routing_distances.py Function: propagate_distances_node at line 328 Total time: 807.234 s Line # Hits Time Per Hit % Time Line Contents 328 @profile 329 def propagate_distances_node(self, node_a, cutoff_distance=200): 330 331 # a […]

什么是Haskell的stream融合

什么是Haskell的Stream Fusion,我该如何使用它?

为什么在Python中“.join()比+ =快?

我可以在网上find大量的信息(Stack Overflow和其他方式),了解如何在Python中使用+或+=进行连接,这是一种非常低效和糟糕的做法。 我似乎无法findWHY +=是如此低效。 除了在这里提到“在某些情况下已经优化20%”(还不清楚这些情况是怎么样的),我找不到任何额外的信息。 在更技术层面上发生了什么,使''.join()优于其他Python连接方法?

HTML中的<script>标签位置是否会影响网页的性能?

如果脚本标签位于HTML页面的上方或下方,对于网站的性能是否有影响? 而如果在这样的使用之间呢: <body> ..blah..blah.. <script language="JavaScript" src="JS_File_100_KiloBytes"> function f1() { .. some logic reqd. for manipulating contents in a webpage } </script> … some text here too … </body> 还是这样更好? <script language="JavaScript" src="JS_File_100_KiloBytes"> function f1() { .. some logic reqd. for manipulating contents in a webpage } </script> <body> ..blah..blah.. ..call above functions on some […]

Pow()与const非整数指数的优化?

我在我的代码中有热点,我正在做pow() ,占我执行时间的10-20%左右。 我对pow(x,y)input是非常具体的,所以我想知道是否有一种方法能够以更高的性能滚动两个pow()近似值(每个指数一个) 我有两个常数指数:2.4和1 / 2.4。 当指数为2.4时, x将在范围内(0.090473935,1.0)。 当指数为1 / 2.4时, x将在(0.0031308,1.0)的范围内。 我正在使用SSE / AVX float向量。 如果平台具体可以被利用,就对! 尽pipe我对全精度( float )algorithm也很感兴趣,但最大错误率在0.01%左右是理想的。 我已经使用了一个快速的pow() 近似 ,但是没有考虑到这些限制。 有没有可能做得更好?

我如何在C中请求“至less”一个int的大小?

情况: 我有一个用C语言编写的应用程序,这个应用程序是资源密集型的,并且devise为可移植 我想让编译器为体系结构select最快的int大小,只要它至less是32位。 是否可以select“至less”32位的大小,还是编译器会自动优化这些types的东西?