如何findC + +中的两个std :: set的交集?

我一直在试图find在C ++中的两个std :: set之间的交集,但我不断收到错误。

我为此创build了一个小样本testing

#include <iostream> #include <vector> #include <algorithm> #include <set> using namespace std; int main() { set<int> s1; set<int> s2; s1.insert(1); s1.insert(2); s1.insert(3); s1.insert(4); s2.insert(1); s2.insert(6); s2.insert(3); s2.insert(0); set_intersection(s1.begin(),s1.end(),s2.begin(),s2.end()); return 0; } 

后面的程序不会生成任何输出,但是我希望有一个新的集合(让我们称之为s3 )和下面的值:

 s3 = [ 1 , 3 ] 

相反,我得到的错误:

 test.cpp: In function 'int main()': test.cpp:19: error: no matching function for call to 'set_intersection(std::_Rb_tree_const_iterator<int>, std::_Rb_tree_const_iterator<int>, std::_Rb_tree_const_iterator<int>, std::_Rb_tree_const_iterator<int>)' 

我所知道的这个错误是,在set_intersection中没有定义接受Rb_tree_const_iterator<int>作为参数。

此外,我想std::set.begin()方法返回这种types的对象,

有没有更好的方法来findC + +中的两个std::set的交集? 最好是一个内置函数?

非常感谢!

你还没有提供一个输出迭代器set_intersection

 template <class InputIterator1, class InputIterator2, class OutputIterator> OutputIterator set_intersection ( InputIterator1 first1, InputIterator1 last1, InputIterator2 first2, InputIterator2 last2, OutputIterator result ); 

通过做类似的事来解决这个问题

 ...; set<int> intersect; set_intersection(s1.begin(),s1.end(),s2.begin(),s2.end(), std::inserter(intersect,intersect.begin())); 

你需要一个std::insert迭代器,因为set现在是空的。 我们不能使用back_或front_inserter,因为set不支持这些操作。

看看链接中的示例: http : //en.cppreference.com/w/cpp/algorithm/set_intersection

您需要另一个容器来存储交集数据,下面的代码假设工作:

 std::vector<int> common_data; set_intersection(s1.begin(),s1.end(),s2.begin(),s2.end(), std::back_inserter(common_data)); 

参见std :: set_intersection 。 您必须添加一个输出迭代器,您将在其中存储结果:

 #include <iterator> std::vector<int> s3; set_intersection(s1.begin(),s1.end(),s2.begin(),s2.end(), std::back_inserter(s3)); 

查看Ideone完整列表。

只是在这里评论。 我认为是时候添加联合,相交操作的设置界面。 我们在未来的标准中提出这个build议。 我一直在使用std很久,每次使用set操作时我都希望std比较好。 对于一些复杂的设置操作,比如相交,你可以简单地(更容易)修改下面的代码:

 template <class InputIterator1, class InputIterator2, class OutputIterator> OutputIterator set_intersection (InputIterator1 first1, InputIterator1 last1, InputIterator2 first2, InputIterator2 last2, OutputIterator result) { while (first1!=last1 && first2!=last2) { if (*first1<*first2) ++first1; else if (*first2<*first1) ++first2; else { *result = *first1; ++result; ++first1; ++first2; } } return result; } 

http://www.cplusplus.com/reference/algorithm/set_intersection/复制;

例如,如果你的输出是一个集合,你可以输出.insert(* first1)。 而且,你的函数可能不是模板化的。如果你的代码比使用std set_intersection函数的时候短,那就继续吧。

如果你想做两个联合你可以简单地setA.insert(setB.begin(),setB.end()); 这比set_union方法简单得多。 但是,这不适用于vector。

被接受的答案中的第一个(正确投票)的评论抱怨现有的标准设置操作缺less操作员。

一方面,我了解标准库中缺less这样的操作员。 另一方面,如果需要,很容易添加它们(为了个人的喜悦)。 我超载了

  • operator *()为集合的交集
  • operator +()用于联合集合。

示例test-set-ops.cc

 #include <algorithm> #include <iterator> #include <set> template <class T, class CMP = std::less<T>, class ALLOC = std::allocator<T> > std::set<T, CMP, ALLOC> operator * ( const std::set<T, CMP, ALLOC> &s1, const std::set<T, CMP, ALLOC> &s2) { std::set<T, CMP, ALLOC> s; std::set_intersection(s1.begin(), s1.end(), s2.begin(), s2.end(), std::inserter(s, s.begin())); return s; } template <class T, class CMP = std::less<T>, class ALLOC = std::allocator<T> > std::set<T, CMP, ALLOC> operator + ( const std::set<T, CMP, ALLOC> &s1, const std::set<T, CMP, ALLOC> &s2) { std::set<T, CMP, ALLOC> s; std::set_union(s1.begin(), s1.end(), s2.begin(), s2.end(), std::inserter(s, s.begin())); return s; } // sample code to check them out: #include <iostream> using namespace std; template <class T> ostream& operator << (ostream &out, const set<T> &values) { const char *sep = " "; for (const T &value : values) { out << sep << value; sep = ", "; } return out; } int main() { set<int> s1 { 1, 2, 3, 4 }; cout << "s1: {" << s1 << " }" << endl; set<int> s2 { 0, 1, 3, 6 }; cout << "s2: {" << s2 << " }" << endl; cout << "I: {" << s1 * s2 << " }" << endl; cout << "U: {" << s1 + s2 << " }" << endl; return 0; } 

编译和testing:

 $ g++ -std=c++11 -o test-set-ops test-set-ops.cc $ ./test-set-ops s1: { 1, 2, 3, 4 } s2: { 0, 1, 3, 6 } I: { 1, 3 } U: { 0, 1, 2, 3, 4, 6 } $ 

我不喜欢的是运营商的返回值的副本。 可能是,这可以使用移动作业来解决,但这仍然超出了我的技能。

由于我对这些“新花式”移动语义的了解有限,所以我担心操作者返回可能会导致返回集合的副本。 Olaf Dietsche指出,这些问题是不必要的,因为std::set已经配备了移动构造函数/赋值。

虽然我相信他,但我正在考虑如何检查(像“自信”)。 其实这很简单 由于模板必须在源代码中提供,因此您可以简单地使用debugging器。 因此,我在return s;处设置了一个断点return s;operator *() ,然后单步执行,立即引导到std::set::set(_myt&& _Right)std::set::set(_myt&& _Right) – 移动构造函数。 谢谢,奥拉夫,(我)的启示。

为了完整起见,我也实现了相应的赋值操作符

  • operator *=()表示“破坏性”交集
  • operator +=()用于“破坏性”集合的联合。

示例test-set-assign-ops.cc

 #include <iterator> #include <set> template <class T, class CMP = std::less<T>, class ALLOC = std::allocator<T> > std::set<T, CMP, ALLOC>& operator *= ( std::set<T, CMP, ALLOC> &s1, const std::set<T, CMP, ALLOC> &s2) { auto iter1 = s1.begin(); for (auto iter2 = s2.begin(); iter1 != s1.end() && iter2 != s2.end();) { if (*iter1 < *iter2) iter1 = s1.erase(iter1); else { if (!(*iter2 < *iter1)) ++iter1; ++iter2; } } while (iter1 != s1.end()) iter1 = s1.erase(iter1); return s1; } template <class T, class CMP = std::less<T>, class ALLOC = std::allocator<T> > std::set<T, CMP, ALLOC>& operator += ( std::set<T, CMP, ALLOC> &s1, const std::set<T, CMP, ALLOC> &s2) { s1.insert(s2.begin(), s2.end()); return s1; } // sample code to check them out: #include <iostream> using namespace std; template <class T> ostream& operator << (ostream &out, const set<T> &values) { const char *sep = " "; for (const T &value : values) { out << sep << value; sep = ", "; } return out; } int main() { set<int> s1 { 1, 2, 3, 4 }; cout << "s1: {" << s1 << " }" << endl; set<int> s2 { 0, 1, 3, 6 }; cout << "s2: {" << s2 << " }" << endl; set<int> s1I = s1; s1I *= s2; cout << "s1I: {" << s1I << " }" << endl; set<int> s2I = s2; s2I *= s1; cout << "s2I: {" << s2I << " }" << endl; set<int> s1U = s1; s1U += s2; cout << "s1U: {" << s1U << " }" << endl; set<int> s2U = s2; s2U += s1; cout << "s2U: {" << s2U << " }" << endl; return 0; } 

编译和testing:

 $ g++ -std=c++11 -o test-set-assign-ops test-set-assign-ops.cc $ ./test-set-assign-ops s1: { 1, 2, 3, 4 } s2: { 0, 1, 3, 6 } s1I: { 1, 3 } s2I: { 1, 3 } s1U: { 0, 1, 2, 3, 4, 6 } s2U: { 0, 1, 2, 3, 4, 6 } $