Nguyên Lý Hoạt Động Của Vnstock

Vnstock là một thư viện Python về bản chất là công cụ đọc dữ liệu công khai và xử lý, chuẩn hoá định dạng dữ liệu thành tiêu chuẩn chung giúp các AI Agent và người dùng dễ dàng sử dụng để phân tích đầu tư.

Nhấn vào từng tầng để xem chi tiết cơ chế hoạt động

Nguồn dữ liệu đầu vào

Các website cho phép truy cập dữ liệu tài chính công khai phục vụ phân tích và đầu tư chứng khoán.

REST API

Trang HTML

Sitemap/RSS Feed

WebSocket

REST API

Các công ty chứng khoán (Vietcap, KB Securities, vv)

Trang HTML

Bảng biểu, nội dung chi tiết tin tức

Sitemap/RSS Feed

Báo chí tài chính (CafeF, VietStock)

WebSocket

Dữ liệu thời gian thực

Vnstock về bản chất là một công cụ đọc và chuẩn hoá dữ liệu — hoạt động tương tự như trình duyệt web, kết nối người dùng tới các nguồn dữ liệu công khai mà họ có quyền truy cập.

Dữ liệu chính được truy xuất từ hạ tầng chia sẻ của các công ty chứng khoán (Vietcap, KB Securities, Mirae Assets, v.v.) — những tổ chức sở hữu dữ liệu phục vụ phân tích và đầu tư cho đại chúng.

Toàn bộ quá trình diễn ra qua giao thức HTTP tiêu chuẩn, không yêu cầu xác thực định danh. Dữ liệu thu được có chất lượng cao và có thể kiểm chứng với nhiều nguồn tham chiếu khác nhau.

Truy vấn HTTP không xác thực — Cách tiếp cận dữ liệu công khai tiêu chuẩn trên web

Tầng kết nối

Tự động hóa quá trình truy cập và đọc dữ liệu từ các API công khai mà không yêu cầu đăng nhập hay phiên làm việc riêng.

requests

BeautifulSoup

json

websocket-client

requests

Gửi yêu cầu HTTP lấy dữ liệu

BeautifulSoup

Bóc tách cấu trúc HTML/XML

json

Đọc và giải mã dữ liệu JSON từ API

websocket-client

Subscribe dữ liệu được trao đổi theo thời gian thực

Fetcher hoạt động giống như một trình duyệt tự động: gửi HTTP request đến URL công khai và nhận dữ liệu trả về dưới dạng JSON, HTML hoặc mã nhị phân.

Người truy cập không trải qua bước xác thực định danh (authentication) — đây là đặc điểm quan trọng giúp dữ liệu từ Vnstock luôn minh bạch về nguồn gốc và tham chiếu.

Dữ liệu thô → Chuyển tiếp vào hệ thống bộ nhớ

Tầng chuẩn hoá

Đảm nhận việc làm sạch, ép kiểu và đồng bộ hệ quy chiếu, biến đổi dữ liệu thô phi cấu trúc thành định dạng tiêu chuẩn.

Bóc tách & Giải mã

Ép kiểu dữ liệu

Đồng bộ Đơn vị

Chuẩn hoá tên gọi

Chuẩn hoá bảng

Bóc tách & Giải mã

Giải mã ý nghĩa từ dữ liệu thô

Ép kiểu dữ liệu

Định dạng Số, Chuỗi, Thời gian

Đồng bộ Đơn vị

Chuyển đổi Tỷ, Nghìn, % về quy chuẩn

Chuẩn hoá tên gọi

Đồng nhất tiêu chuẩn tên gọi

Chuẩn hoá bảng

Tổ chức thành bảng dữ liệu

Mỗi nguồn dữ liệu trả về cấu trúc khác nhau (tên cột, đơn vị, kiểu dữ liệu). Standardizer đồng bộ tất cả về một chuẩn duy nhất.

Ví dụ: Nguồn VCI trả về dữ liệu giá đóng cửa có tên "c" tron chuỗi json kiểu số nguyên với đơn vị đồng, Standardizer chuyển thành cột "close" kiểu số thực, đơn vị ngìn đồng.

Output cuối cùng luôn là pandas DataFrame với cấu trúc cố định — giúp code phân tích hoạt động nhất quán bất kể nguồn dữ liệu.

Dữ liệu dạng bảng (DataFrame) → Đưa vào xử lý nghiệp vụ tài chính

Tầng nghiệp vụ

Triển khai kiến trúc dữ liệu toàn diện: chọn lọc, kết hợp & tính toán các bộ dữ liệu chuyên sâu cho từng nhóm phân tích.

Nhóm Tham chiếu

Nhóm Thị trường

Nhóm Tài chính

Nhóm Vĩ mô

Nhóm Insights

Nhóm Tham chiếu

Dữ liệu mã, ngành, sàn giao dịch, công ty

Nhóm Thị trường

Chỉ số, Giá & Khối lượng, cung cầu, độ rộng, khối ngoại, vv

Nhóm Tài chính

Báo cáo tài chính, chỉ số tài chính

Nhóm Vĩ mô

Dữ liệu kinh tế vĩ mô, lãi suất, tỷ giá, hàng hoá, vv

Nhóm Insights

Tìm kiếm cơ hội, đánh giá và xếp hạng

Mỗi module thực thi logic nghiệp vụ riêng biệt: tính toán chỉ số, kết hợp nhiều API, lọc và chuyển đổi dữ liệu theo yêu cầu phân tích.

Ví dụ: Module Fundamental gọi nhiều API khác nhau để lấy Bảng cân đối kế toán, Kết quả kinh doanh, Lưu chuyển tiền tệ — rồi chuẩn hoá thành một DataFrame thống nhất.

Screener cho phép thiết lập điều kiện lọc đa tiêu chí (P/E, ROE, tăng trưởng doanh thu...) và trả về danh sách mã phù hợp.

Chuẩn hóa truy xuất thông qua bộ định tuyến (Adapter)

Tầng thích ứng

Đóng vai trò trung gian bền vững: dịch yêu cầu thao tác của người dùng tới đúng nguồn dữ liệu và xử lý lỗi kết nối tự động.

Điều hướng Nguồn

Khớp Tham số

Xử lý Lỗi & Thử lại

Điều hướng Nguồn

Phân bổ lệnh gọi (VCI / KBS / TCBS...)

Khớp Tham số

Cấu hình lệnh tiêu chuẩn tương thích hệ thống

Xử lý Lỗi & Thử lại

Tự động khôi phục kết nối khi gặp gián đoạn

Adapter giúp người dùng chỉ cần thay đổi tham số `source` để chuyển đổi giữa các nguồn dữ liệu mà không cần viết code phức tạp.

Khi một nguồn gặp lỗi (timeout, server down), người dùng chọn chuyển đổi tới nguồn dự phòng thông qua Adapter.

Tầng này không chứa logic nghiệp vụ — chỉ đảm bảo khớp chính xác giữa giao diện người dùng và lõi hệ thống.

Phương thức điều khiển trực quan cho nhà phát triển

Tầng giao diện

Hệ thống cú pháp lệnh thông qua "Unified UI" được thiết kế tối giản lấy cảm hứng từ chuẩn mực quốc tế, hỗ trợ quá trình phân tích dữ liệu hiệu quả.

Market()

Fundamental()

Macro()

Reference()

Insights()

Analytics()

Market()

Giá, khối lượng, giao dịch nội bộ & khối ngoại

Fundamental()

Báo cáo tài chính & chỉ số định giá doanh nghiệp

Macro()

Dữ liệu kinh tế vĩ mô, lãi suất, tỷ giá

Reference()

Thông tin tham chiếu: mã CK, ngành, sàn, công ty

Insights()

Bộ lọc cổ phiếu, đánh giá & xếp hạng

Analytics()

Phân tích kỹ thuật & mô hình thống kê

Đây là tầng duy nhất người dùng tương tác trực tiếp. Cú pháp được thiết kế thống nhất giữa các nhóm chức năng, giúp giảm thời gian làm quen.

Tham số đầu vào tuân theo chuẩn quốc tế (ISO date format, snake_case naming) để đảm bảo khả năng tương thích với các công cụ phân tích phổ biến.

Mỗi class cung cấp các method riêng biệt (history, financial_report, intraday...) với hỗ trợ auto-complete và tài liệu tham chiếu tích hợp.

Kết quả đầu ra tương thích đa định dạng

Đầu ra hệ thống

Dữ liệu sau khi hoàn thiện, sẵn sàng kết nối với các hệ sinh thái phân tích chuyên nghiệp và các dự án kết hợp AI Agent.

Bảng dữ liệu Pandas

Lưu trữ & Trích xuất

Nền tảng cho AI Agent

Bảng dữ liệu Pandas

Trực quan hóa, phân tích mô hình & kiểm thử chiến lược

Lưu trữ & Trích xuất

Tương thích CSDL (PostgreSQL, DuckDB) và file (CSV, Parquet)

Nền tảng cho AI Agent

Tạo môi trường lập trình hiệu quả với AI Agent

Dữ liệu đầu ra mặc định là pandas DataFrame — chuẩn chung cho xử lý dữ liệu trong Python, tương thích đa nền tảng công cụ.

Dữ liệu có thể được lưu trữ trực tiếp vào các CSDL hiệu năng cao (DuckDB, PostgreSQL) hoặc xuất ra file Parquet/CSV để chia sẻ.

Với chuẩn đầu ra nhất quán, tài liệu đầy đủ, Agent Skill hiện đại, dữ liệu từ Vnstock tích hợp liền mạch vào các AI Agent tự động.

Nguyên tắc thiết kế cốt lõi

Ba nguyên tắc nền tảng định hình toàn bộ kiến trúc Vnstock.

Minh bạch nguồn gốc

Mọi dữ liệu đều truy xuất từ nguồn công khai qua giao thức web, không lưu trữ bản sao trung gian để phân phối. Người dùng luôn kết nối tới trang web mục tiêu thông qua công cụ Vnstock.

Tách bạch lớp xử lý

Kiến trúc phân tầng tách biệt rõ ràng giữa thu thập, chuẩn hoá, nghiệp vụ, kết nối và giao diện. Thay đổi một tầng không làm ảnh hưởng đến các tầng còn lại.

Đầu ra chuẩn hoá

Bất kể nguồn dữ liệu nào, đầu ra luôn là pandas DataFrame với cấu trúc cố định, đặt tên, định dạng và đơn vị thống nhất — sẵn sàng để phân tích ngay.

Sẵn sàng sử dụng Vnstock?

Khám phá tài liệu hướng dẫn chi tiết hoặc tìm hiểu thêm về kiến trúc thư viện để tùy chỉnh theo nhu cầu.

Khám phá Tài liệu API Xem Kiến trúc thư viện