Я использую Spark Streaming для получения твитов из твиттера, создавая StreamingContext как:val ssc = new StreamingContext("local[3]", "TwitterFeed",Minutes(1))
и создать твиттер-поток как:val tweetStream = TwitterUtils.createStream(ssc, Some(new OAuthAuthorization(Util.config)),filters)
затем сохраните его как текстовый файл tweets.repartition(1).saveAsTextFiles("/tmp/spark_testing/")
и проблема в том, что твиты сохраняются в виде папок в зависимости от времени пакета, но мне нужны все данные каждого пакета в одной папке.
Есть ли обходной путь для этого?
Спасибо