CRAWL DATA May 12, 2023

Cracking the Code: Mastering Redfin's Web Scraping Protection

Words count 12k Reading time 11 mins.

In this topic, we will delve into the intriguing world of web scraping protection on Redfin Houses - a well-known platform for real estate listings. The primary technique employed here involves utilizing HTTP requests with pure Python, eliminating the need for a web driver like Selenium. This approach allows us to utilize it in various environments...

Read article

CRAWL DATA May 12, 2023

Cracking the Code: Mastering Redfin's Web Scraping Protection

Words count 12k Reading time 11 mins.

In this topic, we will delve into the intriguing world of web scraping protection on Redfin Houses - a well-known platform for real estate listings. The primary technique employed here involves utilizing HTTP requests with pure Python, eliminating the need for a web driver like Selenium. This approach allows us to utilize it in various environments, including Colab and non-browser-supported environments.

Read article

ALGORITHM July 14, 2022

Apply Sliding Window technique with Two Pointers

Words count 4.3k Reading time 4 mins.

Motivated by my successful solution to the “Longest Substring Without Repeating Characters” problem on Leetcode, I eagerly present the “Sliding Window” technique, a simple yet intriguing method that leverages two pointers to achieve optimal performance.

Read article

ALGORITHM June 29, 2022

KickStart Practice #2: Building Palindromes

Words count 14k Reading time 13 mins.

Palindrome string is one of the problems always presents in Interview or Competitive Programming. Google Kick Start has launched there practice session in four days, included Building Palindromes.

Read article

CRAWL DATA June 27, 2022

Crawl data from App Store Connect

Words count 6.8k Reading time 6 mins.

In this article, I will show you the way to get Units, the term indicates how many downloads on your own application published on App Store, following by days, months, years, using Python script

Read article

ALGORITHM December 27, 2021

Shuffle strategic for limited resources

Words count 15k Reading time 13 mins.

On the early stage of Machine Learning, Data Mining progress, one of the problems we have to deal with processing large-size file, including corpus shuffle, usually its size would be larger than our limited resources like memory or capacity. Let’s say, the file is 30GB, whereas the provided memory is 8GB or 16GB, we surely cannot load entire them to memory in term of resource shuffling distribution notion. Therefore, the strategic tends to serve ...

Read article

Article September 21, 2021

Kỷ nguyên Digital Transformation - không chỉ là công nghệ

Words count 9.9k Reading time 9 mins.

Trong những năm gần đây, khi nhắc đến cuộc Cách mạng Công nghiệp mới, một trong những khái niệm được nhắc đến nhiều nhất chính là Digital Transformation – hay Chuyển Đổi Số (CDS). Tuy nhiên, không phải ai cũng thực sự hiểu rõ CDS là gì, nó khác gì so với Số hóa (Digitization), Kỹ thuật số hóa (Digitalization), hay đơn thuần là việc đưa phần mềm vào vận hành.

Read article

ALGORITHM September 03, 2021

Tìm trung vị của 2 dãy đã được sắp xếp

Words count 16k Reading time 14 mins.

Cho hai dãy nums1, nums2 đã được sắp xếp theo thứ tự có size là mn, hãy tìm trung vị (median) của hai dãy đó.

Đây là bài toán được xem là mức độ khó trên leetcode.com, thách thức của bài này là thuật toán phải được chạy với time O(log(m+n))

Read article

SOFTSKILL April 01, 2021

Văn hoá hỏi đáp trên StackOverflow

Words count 6.4k Reading time 6 mins.

StackOverFlow (SO) trong bài viết đề cập đến là một cộng đồng của các developer tại stackoverflow.com, mặc dù còn khá non trẻ khi ra đời vào khoảng 2008 nếu so sánh với các cộng đồng lớn mạnh khác, nhưng nó lại mang đến hiệu quả rất lớn cho hệ thống tri thức của dev, không khác gì wikipedia hay google.

Read article
0%