DataFu ay binuo sa LinkedIn at ay ganap na nakasulat sa Java.
DataFu kasamang function / aklatan para sa pakikipagtulungan sa:
- Mga istatistika
- pagpapahalaga
- Sampling
- Sessions
- Link Pagsusuri
- Set operations
- Bags
DataFu ay perpekto para sa data mining at pang-istatistikang mga aplikasyon nagtatrabaho sa tuktok ng Hadoop o Pig database.
Ang mga pag-andar payagan ang mga developer upang mapakinabangan nang husto ng lahat ng mga data na naka-imbak sa loob ng isang Hadoop o Pig database nang hindi na kinakailangang upang harapin ang napakalaking mga kinakailangan ng system upang gawin ito.
Ano ang bago sa ito release:.
- Pares ng UDFs para sa simpleng random sampling may kapalit
- Higit dependencies ngayon nakabalot sa DataFu kaya mas kaunting JAR dependencies kinakailangan.
- SetDifference UDF para sa computing set pagkakaiba (halimbawa A-B o A-B-C).
Ano ang bago sa bersyon 1.2.0:
- Pares ng UDFs para sa simpleng random sampling na may kapalit.
- Higit dependencies ngayon nakabalot sa DataFu kaya mas kaunting JAR dependencies kinakailangan.
- SetDifference UDF para sa computing set pagkakaiba (halimbawa A-B o A-B-C).
Ano ang bago sa bersyon 1.1.0:.
- Added SHA hash UDF
- InUDF at AssertUDF idinagdag para sa Pig 0.12 compatibility. Ang mga ito ay ang parehong bilang In at igiit.
- SimpleRandomSample, na nagpapatupad ng isang scalable simple random sampling algorithm.
Mga Komento hindi natagpuan