Tag: 分组

sql组通过与独特

当查询中没有完成聚合时,为什么有人会使用一个组而不使用一个组? 另外,有人知道在MySQL和SQL Server中,不同的性能考虑。 我猜SQL Server有一个更好的优化器,他们可能接近于同等的地位,但在MySQL中,我期望明显的性能优势。 我对dba的答案感兴趣。 编辑: 比尔的post很有趣,但不适用。 让我更具体的… select a, b, c from table x group by a, b,c 与 select distinct a,b,c from table x

LINQ:结合连接和分组

我有一个查询,结合了一个连接和一个组,但我有一个问题。 查询如下所示: var result = from p in Products join bp in BaseProducts on p.BaseProductId equals bp.Id group p by p.SomeId into pg select new ProductPriceMinMax { SomeId = pg.FirstOrDefault().SomeId, CountryCode = pg.FirstOrDefault().CountryCode, MinPrice = pg.Min(m => m.Price), MaxPrice = pg.Max(m => m.Price), BaseProductName = bp.Name <—— can't use bp. }; 如您所见,它将Products表与BaseProducts表连接起来,并将其分组在Product表的id上。 但在生成的ProductPriceMinMax中,我还需要BaseProducts表的一个属性:bp.Name,但它不知道bp。 任何想法我做错了什么? 谢谢!

按值分组

比方说,我有这样一个列表: list = [["A",0], ["B",1], ["C",0], ["D",2], ["E",2]] 我怎样才能最优雅的组合这个得到这个列表输出在Python中: list = [["A", "C"], ["B"], ["D", "E"]] 所以这些值是按secound值分组的,但顺序是保留的。

使用lodash .groupBy。 如何为分组输出添加自己的密钥?

我有从API返回这个示例数据。 我正在使用Lodash的_.groupBy将数据转换成我可以更好地使用的对象。 返回的原始数据是这样的: [ { "name": "jim", "color": "blue", "age": "22" }, { "name": "Sam", "color": "blue", "age": "33" }, { "name": "eddie", "color": "green", "age": "77" } ] 我想_.groupBy函数返回一个如下所示的对象: [ { color: "blue", users: [ { "name": "jim", "color": "blue", "age": "22" }, { "name": "Sam", "color": "blue", "age": "33" } ] }, { […]

如何selectMySQL中每个组的第一行?

在C#中会是这样的: table .GroupBy(row => row.SomeColumn) .Select(group => group .OrderBy(row => row.AnotherColumn) .First() ) Linq-To-Sql将其转换为以下T-SQL代码: SELECT [t3].[AnotherColumn], [t3].[SomeColumn] FROM ( SELECT [t0].[SomeColumn] FROM [Table] AS [t0] GROUP BY [t0].[SomeColumn] ) AS [t1] OUTER APPLY ( SELECT TOP (1) [t2].[AnotherColumn], [t2].[SomeColumn] FROM [Table] AS [t2] WHERE (([t1].[SomeColumn] IS NULL) AND ([t2].[SomeColumn] IS NULL)) OR (([t1].[SomeColumn] IS NOT […]

Perl中的正则expression式组:如何从正则expression式组中捕获元素,匹配来自string的未知数/多个/variables出现的元素?

在Perl中,如何使用一个正则expression式分组来捕获多个匹配它的事件,并将它们分成几个数组元素? 例如,对于一个string: var1=100 var2=90 var5=hello var3="a, b, c" var7=test var3=hello 用代码处理: $string = "var1=100 var2=90 var5=hello var3=\"a, b, c\" var7=test var3=hello"; my @array = $string =~ <regular expression here> for ( my $i = 0; $i < scalar( @array ); $i++ ) { print $i.": ".$array[$i]."\n"; } 我希望看到作为输出: 0: var1=100 1: var2=90 2: var5=hello 3: […]

带有NaN(缺失)值的groupby列

我有一个DataFrame的列中有许多缺less的值,我希望groupby: import pandas as pd import numpy as np df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']}) In [4]: df.groupby('b').groups Out[4]: {'4': [0], '6': [2]} 看到Pandas已经删除了NaN目标值的行。 (我想包括这些行!) 因为我需要很多这样的操作(许多cols缺less值),并且使用比中位数(通常是随机森林)更复杂的函数,所以我想避免编写太复杂的代码段。 有什么build议么? 我应该为此写一个函数还是有一个简单的解决scheme?

大pandas按组合和列进行sorting

给定以下dataframe In [31]: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar', 'baz'] * 2, 'B': rand.randn(6), 'C': rand.rand(6) > .5}) In [32]: df Out[32]: ABC 0 foo 1.624345 False 1 bar -0.611756 True 2 baz -0.528172 False 3 foo -1.072969 True 4 bar 0.865408 False 5 baz -2.301539 True 我想按组合( A )按B总和,然后按C (不汇总)的值sorting。 所以基本上得到了A组的顺序 In […]

按属性分组对象列表:Java

我需要使用特定对象的属性(位置)将对象列表(学生)分组,代码如下所示, public class Grouping { /** * @param args the command line arguments */ public static void main(String[] args) { List<Student> studlist = new ArrayList<Student>(); studlist.add(new Student("1726", "John", "New York")); studlist.add(new Student("4321", "Max", "California")); studlist.add(new Student("2234", "Andrew", "Los Angeles")); studlist.add(new Student("5223", "Michael", "New York")); studlist.add(new Student("7765", "Sam", "California")); studlist.add(new Student("3442", "Mark", "New York")); //Code to […]

PostgreSQL查询按天计算/分组,显示没有数据的日子

我需要创build一个返回的PostgreSQL查询 一天 当天发现的物体数量 即使在当天没有find任何物品, 每一天都会出现在结果中 ,这一点很重要。 (之前已经讨论过这个问题,但是在我的具体情况下,我还没有能够解决问题。) 首先,我发现一个SQL查询来生成一个范围的天 ,我可以join: SELECT to_char(date_trunc('day', (current_date – offs)), 'YYYY-MM-DD') AS date FROM generate_series(0, 365, 1) AS offs 结果是: date ———— 2013-03-28 2013-03-27 2013-03-26 2013-03-25 … 2012-03-28 (366 rows) 现在我试图把它join到一个名为“sharer_emailshare”的表中,该表有一个“created”列: Table 'public.sharer_emailshare' column | type ——————- id | integer created | timestamp with time zone message | text to | […]