Comment convertir cassandra au système de fichiers HDFS pour le requin / requête ruche

voix
-1

Est-il possible d'exposer des données cassandra comme HDFS puis perfom requin / requête Hive sur HDFS ??

Si oui, veuillez fournir quelques liens pour transformer cassandra db en HDFS.

Créé 30/12/2013 à 05:22
source utilisateur
Dans d'autres langues...                            


5 réponses

voix
0

Vous pouvez écrire identité code MapReduce qui prennent entrée du CFS (système de fichiers cassandra) et de vidage des données à HDFS.

Une fois que vous avez données HDFS, vous pouvez mapper une table ruche et exécuter des requêtes.

Créé 30/12/2013 à 10:13
source utilisateur

voix
0

La façon typique d'accéder aux données Cassandra Ruches est d'utiliser le CqlStorageHandler. Détails voir Ruche Support pour Cassandra CQL3 .

Mais si vous avez des raisons d'accéder aux données directement, jetez un oeil à casoar . Il est un « gestionnaire de stockage Ruche pour Cassandra et Shark qui lit les SSTables directement. Cela permet un contrôle total sur les ressources utilisées pour exécuter des requêtes ad hoc pour que l'impact sur la performance en temps réel Cassandra est contrôlée. »

Créé 30/12/2013 à 22:40
source utilisateur

voix
0

Je pense que vous essayez d'exécuter Hive / Shark par rapport aux données déjà Cassandra. Si tel est le cas, alors vous n'avez pas besoin d'y accéder comme HDFS, mais vous avez besoin d'une ruche gestionnaire pour l'utiliser contre Cassandra.

Pour cela , vous pouvez utiliser de Tuplejump projet, CASH Le Readme fournit les instructions sur la façon de construire et de l' utiliser. Si vous voulez mettre vos « grands fichiers » dans Cassandra et requête sur eux, comme vous le faites de HDFS, vous aurez besoin d' un système de fichier qui fonctionne sur Cassandra comme des DataStax de SFC présents dans DSE, ou les SnackFS de Tuplejump (présentes dans le projet Calliope Early Access repo)

Disclaimer: Je travaille pour Tuplejump, Inc.

Créé 25/01/2014 à 11:46
source utilisateur

voix
0

Vous pouvez utiliser Tuplejump projet Calliope. https://github.com/tuplejump/calliope

Configurer le tableau externe Cassandra dans Shark (comme Ruche) à l'aide de stockage Handler prévu dans le code TumpleJump.

Bonne chance!

Créé 20/02/2014 à 09:29
source utilisateur

Créé 11/04/2014 à 11:52
source utilisateur

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more