Avocado hass time series vs predict price

Overview

AVOCADO HASS TIME SERIES VÀ PREDICT PRICE

Trước khi vào Heroku muốn giao diện đẹp mọi người chuyển giúp mình theo hình bên dưới image

predict_avocado

https://avocado-hass.herokuapp.com/ deployed to Heroku

Please change setting to theme dark

Nếu trường muốn coi trên máy local host thì làm các bước sau:

Bước 1: Down code trên github về Bước 2: Vào trang streamlit để thực hiện theo hướng dẫn của treamlit: https://docs.streamlit.io/library/get-started/installation

I. TỔNG QUAN VỀ HỆ THỐNG DỮ LIỆU

  1. Mục đích
    • Dự đoán giá bơ trung bình của bơ "Hass" ở Mỹ
    • Xem xét mở rộng các loại trang trại Bơ đang có trong việc trồng bơ ở các vùng khác
    • Xây dựng mô hình dự báo giá trùng bình của bơ "Hass" ở Mỹ sau đó xem xét việc mở rộng sản xuất kinh doanh
  2. Vi sao có dự án nào ?
    • Ai (Who): Doanh nghiệp là người cần
    • Tại sao (Why): Giá bơ biến động ở các vùng khác nhau ? Có nên trồng bơ các vùng đó không ?
  3. Hiện tại
    • Công ty kinh doanh quả bơ ở rất nhiều vùng của nước Mỹ có 2 loại bơ: Bơ thường và bơ hữu cơ
    • Quy cách đóng gọi theo nhiều quy chuẩn: Small/ Large/ Xlarge Bags
    • Có 3 loại item (product look up) khác nhau: 4046, 4225, 4770
  4. Vấn đề
    • Doanh nghiệp chưa có mô hình dự báo giá bơ cho việc mở rộng
    • Tối ưu sao việc tiếp cận giá bơ tới người tiêu dùng thấp nhất
  5. Thách thức và cách tiếp cận - Challenge and Approach
    • Dữ liệu được lấy trực tiếp từ máy tính tính tiền của các nhà bán lẻ dựa trên doanh số bán lẻ thực tế của bơ Hass
    • Dữ liệu đại diện cho dữ liệu lấy từ máy quét bán lẻ hàng tuần cho lượng bán lẻ (National retail volumn - units) và giá bơ từ tháng 4/2015 đến tháng 3/2018
    • Giá Trung bình (Average Price) trong bảng phản ánh giá trên một đơn vị (mỗi quả bơ), ngay cả khi nhiều đơn vị (bơ) được bán trong bao
    • Mã tra cứu sản phẩm - Product Lookup codes (PLU’s) trong bảng chỉ dành cho bơ Hass, không dành cho các sản phẩm khác.
  6. Data obtained - Thu thập dữ liệu
    • Không thông quan nguồn cào data
    • Toàn bộ dữ liệu được đổ ra và lưu trữ trong tập tin avocado.csv với 18249 record.
    • Có 2 loại bơ trong tập dữ liệu và một số vùng khác nhau. Điều này cho phép chúng ta thực hiện tất cả các loại phân tích cho các vùng khác nhau hoặc phân tích toàn bộ nước mỹ theo một trong 2 loại bơ
  7. Đặt ra yêu cầu với bài toán

Yêu cầu 1: Với bài toán 1: thực hiện dự đoán giá bơ trung bình

  • Thực hiện các tiền xử lý dữ liệu bổ sung (nếu cần)
  • Ngoài những thuật toán regression đã được thực hiện, có thuật toán nào khác cho kết quả tốt hơn không? Thực hiện với thuật toán đó. Tổng hợp kết quả thu được."

Yêu cầu 2: Với bài toán 2: Thực hiện dự đoán giá, khả năng mở rộng trong tương lai với Organic Avocado ở vùng California

Yêu cầu 3: Hãy làm tiếp phần dự đoán giá bơ thường (Conventiton Avocado) của vùng California

Yêu cầu 4: Hãy chọn ra 1 vùng (Trong danh sách các vùng bơ "Hass" đang kinh doanh) mà bạn cho rằng trong tương lai có thể trong trọt, sản xuất kinh doanh (organic và/ hoặc Conventional Avocado). Hãy chứng minh đều này bằng cách triển khai các bài toán như đã với vùng california

II. TỔNG QUAN VỀ THỊ TRƯỜNG

  1. Thị trường Hoa Kỳ image
  2. Mục tiêu và cấn tiếp cận image
  3. Ai là người và cần gì ? image
  4. Kết luận image

III. HƯỚNG DẪN SỬ DỤNG VÀ CHỌN CÁC TÍNH NĂNG DỰ ĐOÁN GIÁ BƠ

image

Owner
hieulmsc
Supply chain management and finance, costing analysis
hieulmsc
A demo project to elaborate how Machine Learn Models are deployed on production using Flask API

This is a salary prediction website developed with the help of machine learning, this makes prediction of salary on basis of few parameters like interview score, experience test score.

1 Feb 10, 2022
K-means clustering is a method used for clustering analysis, especially in data mining and statistics.

K Means Algorithm What is K Means This algorithm is an iterative algorithm that partitions the dataset according to their features into K number of pr

1 Nov 01, 2021
Learning --> Numpy January 2022 - winter'22

Numerical-Python Numpy NumPy is a library for the Python programming language, adding support for large, multi-dimensional arrays and matrices, along

Shahzaneer Ahmed 0 Mar 12, 2022
Compare MLOps Platforms. Breakdowns of SageMaker, VertexAI, AzureML, Dataiku, Databricks, h2o, kubeflow, mlflow...

Compare MLOps Platforms. Breakdowns of SageMaker, VertexAI, AzureML, Dataiku, Databricks, h2o, kubeflow, mlflow...

Thoughtworks 318 Jan 02, 2023
Probabilistic time series modeling in Python

GluonTS - Probabilistic Time Series Modeling in Python GluonTS is a Python toolkit for probabilistic time series modeling, built around Apache MXNet (

Amazon Web Services - Labs 3.3k Jan 03, 2023
A simple machine learning python sign language detection project.

SST Coursework 2022 About the app A python application that utilises the tensorflow object detection algorithm to achieve automatic detection of ameri

Xavier Koh 2 Jun 30, 2022
Predicting Baseball Metric Clusters: Clustering Application in Python Using scikit-learn

Clustering Clustering Application in Python Using scikit-learn This repository contains the prediction of baseball metric clusters using MLB Statcast

Tom Weichle 2 Apr 18, 2022
A Tools that help Data Scientists and ML engineers train and deploy ML models.

Domino Research This repo contains projects under active development by the Domino R&D team. We build tools that help Data Scientists and ML engineers

Domino Data Lab 73 Oct 17, 2022
The Fuzzy Labs guide to the universe of open source MLOps

Open Source MLOps This is the Fuzzy Labs guide to the universe of free and open source MLOps tools. Contents What is MLOps, anyway? Data version contr

Fuzzy Labs 352 Dec 29, 2022
🔬 A curated list of awesome machine learning strategies & tools in financial market.

🔬 A curated list of awesome machine learning strategies & tools in financial market.

GeorgeZou 1.6k Dec 30, 2022
Optimal Randomized Canonical Correlation Analysis

ORCCA Optimal Randomized Canonical Correlation Analysis This project is for the python version of ORCCA algorithm. It depends on Numpy for matrix calc

Yinsong Wang 1 Nov 21, 2021
Laporan Proyek Machine Learning - Azhar Rizki Zulma

Laporan Proyek Machine Learning - Azhar Rizki Zulma Project Overview Domain proyek yang dipilih dalam proyek machine learning ini adalah mengenai hibu

Azhar Rizki Zulma 6 Mar 12, 2022
A Python step-by-step primer for Machine Learning and Optimization

early-ML Presentation General Machine Learning tutorials A Python step-by-step primer for Machine Learning and Optimization This github repository gat

Dimitri Bettebghor 8 Dec 01, 2022
Neighbourhood Retrieval (Nearest Neighbours) with Distance Correlation.

Neighbourhood Retrieval with Distance Correlation Assign Pseudo class labels to datapoints in the latent space. NNDC is a slim wrapper around FAISS. N

The Learning Machines 1 Jan 16, 2022
Kalman filter library

The kalman filter framework described here is an incredibly powerful tool for any optimization problem, but particularly for visual odometry, sensor fusion localization or SLAM.

comma.ai 276 Jan 01, 2023
LibRerank is a toolkit for re-ranking algorithms. There are a number of re-ranking algorithms, such as PRM, DLCM, GSF, miDNN, SetRank, EGRerank, Seq2Slate.

LibRerank LibRerank is a toolkit for re-ranking algorithms. There are a number of re-ranking algorithms, such as PRM, DLCM, GSF, miDNN, SetRank, EGRer

126 Dec 28, 2022
Production Grade Machine Learning Service

This project is made to help you scale from a basic Machine Learning project for research purposes to a production grade Machine Learning web service

Abdullah Zaiter 10 Apr 04, 2022
BentoML is a flexible, high-performance framework for serving, managing, and deploying machine learning models.

Model Serving Made Easy BentoML is a flexible, high-performance framework for serving, managing, and deploying machine learning models. Supports multi

BentoML 4.4k Jan 04, 2023
scikit-learn is a python module for machine learning built on top of numpy / scipy

About scikit-learn is a python module for machine learning built on top of numpy / scipy. The purpose of the scikit-learn-tutorial subproject is to le

Gael Varoquaux 122 Dec 12, 2022
A library of sklearn compatible categorical variable encoders

Categorical Encoding Methods A set of scikit-learn-style transformers for encoding categorical variables into numeric by means of different techniques

2.1k Jan 07, 2023