Find Jobs
Hire Freelancers

Data engineer project / python / PostGres/

₹1500-12500 INR

Kapalı
İlan edilme: 3 yıldan fazla önce

₹1500-12500 INR

Teslimde ödenir
Website: [login to view URL] Data Schema 1. The link contains json data for various data sources. You would have to scan through and filter any COVID related data 2. Design a schema for every state and store data in the respective tables per state 3. Apply various indexing technique on PostGres to enable fast searching DAG performance and efficiency 2. Concepts of Distributed Computing 3. Your choice of schema design 1 NF, 2 NF, 3NF 4. Utilize any async process while performing any loads 5. How would you scale DAG with increase in data volume 6. Logging and monitoring if any failure happens 7. Object oriented design 1. Use Python 3 for developing the solution 2. Utilize Apache Airflow to design a daily dag that would run every day. 3. Create a task within the dag to iterate through the json and download the locally. 4. Create task to load the files into PostGres Schema 5. Optimize your dag performance by achieving max parallelism locally. You could utilize parallelism for task, dag concurrency, thread pool or max_threads 6. Follow the ETL process of Extract, Transform and Load 7. Each dag task should be independent and should be able to run individually. 8. Implement unit or integration test 9. Containerize your application inside a docker container. Use docker-compose if required
Proje No: 28925163

Proje hakkında

2 teklif
Uzaktan proje
Son aktiviteden bu yana geçen zaman 3 yıl önce

Biraz para mı kazanmak istiyorsunuz?

Freelancer'da teklif vermenin faydaları

Bütçenizi ve zaman çerçevenizi belirleyin
Çalışmanız için ödeme alın
Teklifinizin ana hatlarını belirleyin
Kaydolmak ve işlere teklif vermek ücretsizdir
2 freelancers are bidding on average ₹20.556 INR for this job
Kullanıcı Avatarı
I am excellent at python and in other languages also. I worked on many projects like websraping, python automation and data analytics... I will work for this project because it's very easy task for me... please discuss your further project over chat..
₹11.111 INR 7 gün içinde
5,0 (6 değerlendirme)
2,2
2,2
Kullanıcı Avatarı
I've experience devploying Airflow platform (Kubernetes executor + Postgresql main repo) to manage analytical processing mainly with pandas. I have read you project description carefully , docker containerization could be used as well instead of dedicated operators as proposed .
₹30.000 INR 20 gün içinde
0,0 (0 değerlendirme)
0,0
0,0

Müşteri hakkında

   UNITED STATES bayrağı
Mumbai, United States
0,0
0
Ara 16, 2012 tarihinden bu yana üye

Müşteri Doğrulaması

Teşekkürler! Ücretsiz kredinizi talep etmeniz için size bir bağlantı gönderdik.
E-postanız gönderilirken bir şeyler yanlış gitti. Lütfen tekrar deneyin.
Kayıtlı Kullanıcı İlan Edlien Toplam İş
Freelancer ® is a registered Trademark of Freelancer Technology Pty Limited (ACN 142 189 759)
Copyright © 2024 Freelancer Technology Pty Limited (ACN 142 189 759)
Ön izleme yükleniyor
Coğrafik konum için izin verildi.
Giriş oturumunuzun süresi doldu ve çıkış yaptınız. Lütfen tekrar giriş yapın.