Tag: join

为什么pandas在python合并比data.table合并R?

我最近遇到了python的pandas库,根据这个基准testingperformance出非常快的内存合并。 它甚至比R中的data.table包(我select分析的语言)更快。 为什么pandas比data.table ? 是因为python比R有一个固有的速度优势,还是有一些折衷,我不知道? 有没有办法在data.table执行内部和外部连接,而不是通过merge(X, Y, all=FALSE)和merge(X, Y, all=TRUE) ? 以下是用于对各种软件包进行基准testing的R代码和Python代码 。

MySQL从一个表中select所有的列,从另一个表中select一些

如何从一个表中select所有列,并使用JOIN从另一个表中select一些列? 在MySQL中。

MySQL的开放与使用?

在MySQL JOIN , ON和USING()什么区别? 据我所知, USING()只是更方便的语法,而ON允许更多的灵活性,当列名不相同。 然而,这种差异是如此微小,你会认为他们只是废除USING() 。 还有比这个更接近眼睛吗? 如果是,我应该在特定的情况下使用哪一个?

SQL Server中左连接和右连接的区别

我知道在SQL Server中的连接。 例如。 有两个表格Table1,Table2。 有表结构如下。 create table Table1 (id int, Name varchar (10)) create table Table2 (id int, Name varchar (10)) 表1数据如下: Id Name ————- 1 A 2 B 表2数据如下: Id Name ————- 1 A 2 B 3 C 如果我执行下面提到的SQL语句,两个输出将是相同的 select * from Table1 left join Table2 on Table1.id = Table2.id select * from Table2 […]

join两个SELECT语句结果

是否有可能在一个语句中join2个SQL SELECT语句的结果? 我有一个任务数据库,其中每个logging是一个单独的任务,具有截止date(和一个PALT,从开始到截止date只是一个INT天数,年龄也是INT天数。 我想要一张桌子,里面有每个人,他们拥有的任务数量,以及他们拥有的LATE任务的数量(如果有的话)。 我可以很容易地得到这个数据在单独的表中,就像这样: SELECT ks, COUNT(*) AS '# Tasks' FROM Table GROUP BY ks 返回数据如: ks # Tasks person1 7 person2 3 然后我有 SELECT ks, COUNT(*) AS '# Late' FROM Table WHERE Age > Palt GROUP BY ks 它返回: ks # Late person1 1 person2 1 我想join这两个select陈述的结果(由KS) 我试图避免使用临时表,但如果这是唯一可行的方法来做到这一点,我想知道更多关于以这种方式使用临时表。 我也尝试做一些满足条件的count()行,但我无法弄清楚如何做到这一点。 如果可能的话,那也可以。 附录:对不起,我希望我的结果有KS,Tasks和Late的列 KS # […]

在R中合并/连接data.frames的最快方法是什么?

例如(不知道如果最有代表性的例子): N <- 1e6 d1 <- data.frame(x=sample(N,N), y1=rnorm(N)) d2 <- data.frame(x=sample(N,N), y2=rnorm(N)) 这是我到目前为止: d <- merge(d1,d2) # 7.6 sec library(plyr) d <- join(d1,d2) # 2.9 sec library(data.table) dt1 <- data.table(d1, key="x") dt2 <- data.table(d2, key="x") d <- data.frame( dt1[dt2,list(x,y1,y2=dt2$y2)] ) # 4.9 sec library(sqldf) sqldf() sqldf("create index ix1 on d1(x)") sqldf("create index ix2 on d2(x)") […]

我可以解决这个纯粹的MySQL? (在一列中join';'分隔值)

长话短说:我需要把几张表格中的数据放在一起,为了不必画出一张大桌子,我简化了它们。 我需要在一个查询中这样做,而且我不能使用PHP或任何其他语言来处理结果。 (如果我可以简单地使用我的方法,我会使用PHP) 这不会是一个问题,如果我有一个链接表连接t1行到t2,但不幸的是我不能也不能引入一个。 User table: (alias t1) user(varchar 150),resources(varchar 250) +——-+——-+ | user1 | 1;2;4 | +——-+——-+ | user2 | 2 | +——-+——-+ | user3 | 3;4 | +——-+——-+ Resources table: (alias t2) id(int 11 AI), data(text) +—+——-+ | 1 | data1 | +—+——-+ | 2 | data2 | +—+——-+ | 3 | data3 […]

使用此查询实现分页(跳过/带出)function

我一直在尝试了解如何在SQL中实现自定义分页,例如阅读这样的文章 。 我有以下查询,完美的作品。 但是我想用这个来实现分页。 SELECT TOP x PostId FROM ( SELECT PostId, MAX (Datemade) as LastDate from dbForumEntry group by PostId ) SubQueryAlias order by LastDate desc 我想要什么 我有论坛post,有相关的条目。 我想获得最新添加的post,所以我可以select最近辩论的职位。 现在,我希望能够获得“前10到20个最近活跃的职位”,而不是“前10名”。 我试过了什么 我试图在文章中实现ROW函数,但真的没有运气。 任何想法如何实施?

用SQLite完全外联接

SQLite只有INNER和LEFT JOIN。 有没有办法用SQLite做一个完整的外部联接?

mySQL – 使用三个表中的数据和列创build一个新表

我正在尝试创build一个新的表,它将包含三个现有表中的选定数据。 现有的三个表格设置如下,我期望的结果是在底部: people id last_name first_name email 1 Smith Fred Fred@.. 2 Jones Tom Tom@.. 3 Doe Jane Jane@.. taxonomy id taxonomy 1 age 2 gender 3 height details id person_id detail_id content 1 1 1 36 2 1 2 M 3 1 3 5'10" 4 2 1 29 5 2 2 M 6 2 […]