Cracking the Code: Mastering Redfin's Web Scraping Protection
Words count 12k Reading time 11 mins.
In this topic, we will delve into the intriguing world of web scraping protection on Redfin Houses - a well-known platform for real estate listings. The primary technique employed here involves utilizing HTTP requests with pure Python, eliminating the need for a web driver like Selenium. This approach allows us to utilize it in various environments, including Colab and non-browser-supported environments.
Apply Sliding Window technique with Two Pointers
Words count 4.3k Reading time 4 mins.
Motivated by my successful solution to the “Longest Substring Without Repeating Characters” problem on Leetcode, I eagerly present the “Sliding Window” technique, a simple yet intriguing method that leverages two pointers to achieve optimal performance.
KickStart Practice #2: Building Palindromes
Words count 14k Reading time 13 mins.
Palindrome string is one of the problems always presents in Interview or Competitive Programming. Google Kick Start has launched there practice session in four days, included Building Palindromes
.
Crawl data from App Store Connect
Words count 6.8k Reading time 6 mins.
In this article, I will show you the way to get Units, the term indicates how many downloads on your own application published on App Store, following by days, months, years, using Python script
Shuffle strategic for limited resources
Words count 15k Reading time 13 mins.
On the early stage of Machine Learning, Data Mining progress, one of the problems we have to deal with processing large-size file, including corpus shuffle, usually its size would be larger than our limited resources like memory or capacity. Let’s say, the file is 30GB, whereas the provided memory is 8GB or 16GB, we surely cannot load entire them to memory in term of resource shuffling distribution notion. Therefore, the strategic tends to serve ...
Kỷ nguyên Digital Transformation - không chỉ là công nghệ
Words count 9.9k Reading time 9 mins.
Trong những năm gần đây, khi nhắc đến cuộc Cách mạng Công nghiệp mới, một trong những khái niệm được nhắc đến nhiều nhất chính là Digital Transformation – hay Chuyển Đổi Số (CDS). Tuy nhiên, không phải ai cũng thực sự hiểu rõ CDS là gì, nó khác gì so với Số hóa (Digitization), Kỹ thuật số hóa (Digitalization), hay đơn thuần là việc đưa phần mềm vào vận hành.
Tìm trung vị của 2 dãy đã được sắp xếp
Words count 16k Reading time 14 mins.
Cho hai dãy nums1
, nums2
đã được sắp xếp theo thứ tự có size là m
và n
, hãy tìm trung vị (median) của hai dãy đó.
Đây là bài toán được xem là mức độ khó trên leetcode.com, thách thức của bài này là thuật toán phải được chạy với time O(log(m+n))
Văn hoá hỏi đáp trên StackOverflow
Words count 6.4k Reading time 6 mins.
StackOverFlow (SO) trong bài viết đề cập đến là một cộng đồng của các developer tại stackoverflow.com, mặc dù còn khá non trẻ khi ra đời vào khoảng 2008 nếu so sánh với các cộng đồng lớn mạnh khác, nhưng nó lại mang đến hiệu quả rất lớn cho hệ thống tri thức của dev, không khác gì wikipedia hay google.