<?xml version="1.0" encoding="UTF-8" ?>
<rss
    version="2.0"
    xmlns:atom="http://www.w3.org/2005/Atom"
    xmlns:content="http://purl.org/rss/1.0/modules/content/"
    xmlns:webfeeds="http://webfeeds.org/rss/1.0"
    xmlns:media="http://search.yahoo.com/mrss/"
    >
    <channel>
        <title>Data-preprocessing Tag - Viblo</title>
        <link>https://viblo.asia/rss</link>
        <description><![CDATA[Free service for technical knowledge sharing]]></description>
        <atom:link href="https://viblo.asia/rss/tags/data-preprocessing.rss" rel="self"></atom:link>
                <copyright>Sun* Inc.</copyright>
                                                <webfeeds:logo>https://viblo.asia/logo_full.svg</webfeeds:logo>
        <image>
            <url>https://viblo.asia/logo_full.svg</url>
            <title>Data-preprocessing Tag - Viblo</title>
            <link>https://viblo.asia/rss</link>
        </image>
                                <language>vi-vn</language>
        <lastBuildDate>2026-03-17T19:12:40+07:00</lastBuildDate>
                <item>
            <title><![CDATA[Scrapegraph-ai #2: Giải quyết các bài toán truy vấn phức tạp trong hệ thống RAG (with source code)]]></title>
                        <link>https://viblo.asia/p/scrapegraph-ai-2-giai-quyet-cac-bai-toan-truy-van-phuc-tap-trong-he-thong-rag-with-source-code-PAoJeQvDJ1j</link>
            <guid isPermaLink="true">https://viblo.asia/p/scrapegraph-ai-2-giai-quyet-cac-bai-toan-truy-van-phuc-tap-trong-he-thong-rag-with-source-code-PAoJeQvDJ1j</guid>
            <description><![CDATA[1. Giới thiệu

Trong bài viết Scrapegraph-ai #1: Sử dụng sức mạnh của LLMs để giải quyết bài toán thu thập và xử lý dữ liệu cho các hệ thống AI ở kì t...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">himmeow the coder</dc:creator>
            <pubDate>2024-06-30 19:39:20</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Scrapegraph-ai #1: Sử dụng sức mạnh của LLMs để giải quyết bài toán thu thập và xử lý dữ liệu cho các hệ thống AI]]></title>
                        <link>https://viblo.asia/p/scrapegraph-ai-1-su-dung-suc-manh-cua-llms-de-giai-quyet-bai-toan-thu-thap-va-xu-ly-du-lieu-cho-cac-he-thong-ai-EvbLbavPJnk</link>
            <guid isPermaLink="true">https://viblo.asia/p/scrapegraph-ai-1-su-dung-suc-manh-cua-llms-de-giai-quyet-bai-toan-thu-thap-va-xu-ly-du-lieu-cho-cac-he-thong-ai-EvbLbavPJnk</guid>
            <description><![CDATA[Mở đầu:

Trong kỷ nguyên số hiện nay, trí tuệ nhân tạo (AI) đang ngày càng phát triển mạnh mẽ, mang đến những đột phá đáng kinh ngạc trong nhiều lĩnh ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">himmeow the coder</dc:creator>
            <pubDate>2024-06-23 19:46:19</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Quy trình xây dựng hệ thống RAG tích hợp Function Calling (with source code)]]></title>
                        <link>https://viblo.asia/p/quy-trinh-xay-dung-he-thong-rag-tich-hop-function-calling-with-source-code-vlZL98GZJQK</link>
            <guid isPermaLink="true">https://viblo.asia/p/quy-trinh-xay-dung-he-thong-rag-tich-hop-function-calling-with-source-code-vlZL98GZJQK</guid>
            <description><![CDATA[I. Giới thiệu (Introduction)

Trong thời đại bùng nổ thông tin như hiện nay, việc xây dựng hệ thống có khả năng truy xuất và xử lý thông tin hiệu quả ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">himmeow the coder</dc:creator>
            <pubDate>2024-06-16 21:58:54</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Đánh số ảnh theo thứ tự]]></title>
                        <link>https://viblo.asia/p/danh-so-anh-theo-thu-tu-3P0lPGmoZox</link>
            <guid isPermaLink="true">https://viblo.asia/p/danh-so-anh-theo-thu-tu-3P0lPGmoZox</guid>
            <description><![CDATA[Bước đầu tiên trong bài toán custom object detection là thu thập ảnh, các ảnh thường được lấy trên mạng. Khi download các file ảnh trên mạng tên của c...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">AI Coding</dc:creator>
            <pubDate>2021-05-06 13:26:40</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Bài toán trích xuất thông tin từ văn bản - Phần I]]></title>
                        <link>https://viblo.asia/p/bai-toan-trich-xuat-thong-tin-tu-van-ban-phan-i-bJzKmPm659N</link>
            <guid isPermaLink="true">https://viblo.asia/p/bai-toan-trich-xuat-thong-tin-tu-van-ban-phan-i-bJzKmPm659N</guid>
            <description><![CDATA[Đối với bất kỳ ai đang cố gắng với nhiệm vụ phân tích văn bản, cái khó khăn nhất không phải là tìm đúng tài liệu mà là tìm những thông tin chính xác t...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Dark Knight</dc:creator>
            <pubDate>2020-09-15 08:54:05</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Feature Engineering (Phần 5): Phương pháp nâng cao để xử lý dữ liệu dạng văn bản, phi cấu trúc (2/2)]]></title>
                        <link>https://viblo.asia/p/feature-engineering-phan-5-phuong-phap-nang-cao-de-xu-ly-du-lieu-dang-van-ban-phi-cau-truc-22-gAm5yG6wZdb</link>
            <guid isPermaLink="true">https://viblo.asia/p/feature-engineering-phan-5-phuong-phap-nang-cao-de-xu-ly-du-lieu-dang-van-ban-phi-cau-truc-22-gAm5yG6wZdb</guid>
            <description><![CDATA[Xin chào mọi người, trong phần trước của series mình đã giới thiệu với mọi người phần đầu của bài viết Phương pháp nâng cao để xử lý dữ liệu dạng văn ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Cao Minh Ngoc</dc:creator>
            <pubDate>2019-09-19 14:30:08</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Feature Engineering (Phần 5): Phương pháp nâng cao để xử lý dữ liệu dạng văn bản, phi cấu trúc (1/2)]]></title>
                        <link>https://viblo.asia/p/feature-engineering-phan-5-phuong-phap-nang-cao-de-xu-ly-du-lieu-dang-van-ban-phi-cau-truc-12-Qbq5QpgzlD8</link>
            <guid isPermaLink="true">https://viblo.asia/p/feature-engineering-phan-5-phuong-phap-nang-cao-de-xu-ly-du-lieu-dang-van-ban-phi-cau-truc-12-Qbq5QpgzlD8</guid>
            <description><![CDATA[Xin chào mọi người, trong phần trước của series mình đã giới thiệu với mọi người một số phương pháp xử lý truyền thống với dạng dữ liệu văn bản (Text ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Cao Minh Ngoc</dc:creator>
            <pubDate>2019-08-23 20:57:09</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Feature Engineering (Phần 4): Phương pháp xử lý truyền thống với dữ liệu dạng văn bản (Text Data)]]></title>
                        <link>https://viblo.asia/p/feature-engineering-phan-4-phuong-phap-xu-ly-truyen-thong-voi-du-lieu-dang-van-ban-text-data-1Je5EvWYKnL</link>
            <guid isPermaLink="true">https://viblo.asia/p/feature-engineering-phan-4-phuong-phap-xu-ly-truyen-thong-voi-du-lieu-dang-van-ban-text-data-1Je5EvWYKnL</guid>
            <description><![CDATA[Xin chào mọi người, trong phần trước của series mình đã giới thiệu với mọi người một số phương pháp xử lý với dữ liệu dạng phân loại (Categorical Data...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Cao Minh Ngoc</dc:creator>
            <pubDate>2019-07-23 10:51:34</pubDate>
                                                                                                        </item>
            </channel>
</rss>
