ProxySQL · renecannao · Mar 24, 2026 · Mar 24, 2026 · Mar 24, 2026 · Mar 24, 2026
diff --git a/.github/workflows/ci.yml b/.github/workflows/ci.yml
@@ -0,0 +1,30 @@
+name: CI
+
+on:
+  push:
+    branches: [main]
+  pull_request:
+    branches: [main]
+
+jobs:
+  build-and-test:
+    strategy:
+      matrix:
+        os: [ubuntu-22.04, ubuntu-24.04]
+        compiler: [g++, clang++]
+    runs-on: ${{ matrix.os }}
+    steps:
+      - uses: actions/checkout@v4
+
+      - name: Build and test
+        env:
+          CXX: ${{ matrix.compiler }}
+        run: make -f Makefile.new clean && make -f Makefile.new all
+
+  macos:
+    runs-on: macos-latest
+    steps:
+      - uses: actions/checkout@v4
+
+      - name: Build and test
+        run: make -f Makefile.new clean && make -f Makefile.new all
diff --git a/.gitignore b/.gitignore
@@ -42,3 +42,7 @@ src/*_parser/*_lexer.yy.c
 src/*_parser/*_parser.output
 src/*_parser/*_parser.report
 
+# New parser build artifacts
+libsqlparser.a
+run_tests
+run_bench
diff --git a/Makefile.new b/Makefile.new
@@ -0,0 +1,93 @@
+CXX = g++
+CXXFLAGS = -std=c++17 -Wall -Wextra -g -O2
+CPPFLAGS = -I./include -I./third_party/googletest/googletest/include
+
+PROJECT_ROOT = .
+SRC_DIR = $(PROJECT_ROOT)/src/sql_parser
+INCLUDE_DIR = $(PROJECT_ROOT)/include/sql_parser
+TEST_DIR = $(PROJECT_ROOT)/tests
+
+# Library sources
+LIB_SRCS = $(SRC_DIR)/arena.cpp $(SRC_DIR)/parser.cpp
+LIB_OBJS = $(LIB_SRCS:.cpp=.o)
+LIB_TARGET = $(PROJECT_ROOT)/libsqlparser.a
+
+# Google Test library
+GTEST_DIR = $(PROJECT_ROOT)/third_party/googletest/googletest
+GTEST_SRC = $(GTEST_DIR)/src/gtest-all.cc
+GTEST_OBJ = $(GTEST_DIR)/src/gtest-all.o
+GTEST_CPPFLAGS = -I$(GTEST_DIR)/include -I$(GTEST_DIR)
+
+# Test sources
+TEST_SRCS = $(TEST_DIR)/test_main.cpp \
+            $(TEST_DIR)/test_arena.cpp \
+            $(TEST_DIR)/test_tokenizer.cpp \
+            $(TEST_DIR)/test_classifier.cpp \
+            $(TEST_DIR)/test_expression.cpp \
+            $(TEST_DIR)/test_set.cpp \
+            $(TEST_DIR)/test_select.cpp \
+            $(TEST_DIR)/test_emitter.cpp \
+            $(TEST_DIR)/test_stmt_cache.cpp \
+            $(TEST_DIR)/test_insert.cpp \
+            $(TEST_DIR)/test_update.cpp \
+            $(TEST_DIR)/test_delete.cpp \
+            $(TEST_DIR)/test_compound.cpp \
+            $(TEST_DIR)/test_digest.cpp
+TEST_OBJS = $(TEST_SRCS:.cpp=.o)
+TEST_TARGET = $(PROJECT_ROOT)/run_tests
+
+# Google Benchmark
+GBENCH_DIR = $(PROJECT_ROOT)/third_party/benchmark
+GBENCH_SRCS = $(filter-out $(GBENCH_DIR)/src/benchmark_main.cc, $(wildcard $(GBENCH_DIR)/src/*.cc))
+GBENCH_OBJS = $(GBENCH_SRCS:.cc=.o)
+GBENCH_CPPFLAGS = -I$(GBENCH_DIR)/include -I$(GBENCH_DIR)/src -DHAVE_STD_REGEX -DHAVE_STEADY_CLOCK
+
+BENCH_DIR = $(PROJECT_ROOT)/bench
+BENCH_SRCS = $(BENCH_DIR)/bench_main.cpp $(BENCH_DIR)/bench_parser.cpp
+BENCH_OBJS = $(BENCH_SRCS:.cpp=.o)
+BENCH_TARGET = $(PROJECT_ROOT)/run_bench
+
+.PHONY: all lib test bench clean
+
+all: lib test
+
+lib: $(LIB_TARGET)
+
+$(LIB_TARGET): $(LIB_OBJS)
+	ar rcs $@ $^
+	@echo "Built $@"
+
+$(SRC_DIR)/%.o: $(SRC_DIR)/%.cpp
+	$(CXX) $(CXXFLAGS) $(CPPFLAGS) -c $< -o $@
+
+# Google Test object
+$(GTEST_OBJ): $(GTEST_SRC)
+	$(CXX) $(CXXFLAGS) $(GTEST_CPPFLAGS) -c $< -o $@
+
+# Test objects
+$(TEST_DIR)/%.o: $(TEST_DIR)/%.cpp
+	$(CXX) $(CXXFLAGS) $(CPPFLAGS) $(GTEST_CPPFLAGS) -c $< -o $@
+
+test: $(TEST_TARGET)
+	./$(TEST_TARGET)
+
+$(TEST_TARGET): $(TEST_OBJS) $(GTEST_OBJ) $(LIB_TARGET)
+	$(CXX) $(CXXFLAGS) -o $@ $(TEST_OBJS) $(GTEST_OBJ) -L$(PROJECT_ROOT) -lsqlparser -lpthread
+
+# Benchmark objects
+$(GBENCH_DIR)/src/%.o: $(GBENCH_DIR)/src/%.cc
+	$(CXX) $(CXXFLAGS) $(GBENCH_CPPFLAGS) -c $< -o $@
+
+$(BENCH_DIR)/%.o: $(BENCH_DIR)/%.cpp
+	$(CXX) $(CXXFLAGS) $(CPPFLAGS) $(GBENCH_CPPFLAGS) -c $< -o $@
+
+bench: $(BENCH_TARGET)
+	./$(BENCH_TARGET) --benchmark_format=console
+
+$(BENCH_TARGET): $(BENCH_OBJS) $(GBENCH_OBJS) $(LIB_TARGET)
+	$(CXX) $(CXXFLAGS) -o $@ $(BENCH_OBJS) $(GBENCH_OBJS) -L$(PROJECT_ROOT) -lsqlparser -lpthread
+
+clean:
+	rm -f $(LIB_OBJS) $(LIB_TARGET) $(TEST_OBJS) $(GTEST_OBJ) $(TEST_TARGET)
+	rm -f $(BENCH_OBJS) $(GBENCH_OBJS) $(BENCH_TARGET)
+	@echo "Cleaned."
diff --git a/bench/bench_main.cpp b/bench/bench_main.cpp
@@ -0,0 +1,3 @@
+#include <benchmark/benchmark.h>
+
+BENCHMARK_MAIN();
diff --git a/bench/bench_parser.cpp b/bench/bench_parser.cpp
@@ -0,0 +1,239 @@
+#include <benchmark/benchmark.h>
+#include "sql_parser/parser.h"
+#include "sql_parser/emitter.h"
+
+using namespace sql_parser;
+
+// ========== Tier 2: Classification ==========
+// Target: <100ns
+
+static void BM_Classify_Insert(benchmark::State& state) {
+    Parser<Dialect::MySQL> parser;
+    const char* sql = "INSERT INTO users VALUES (1, 'name', 'email')";
+    size_t len = strlen(sql);
+    for (auto _ : state) {
+        auto r = parser.parse(sql, len);
+        benchmark::DoNotOptimize(r.stmt_type);
+    }
+}
+BENCHMARK(BM_Classify_Insert);
+
+static void BM_Classify_Update(benchmark::State& state) {
+    Parser<Dialect::MySQL> parser;
+    const char* sql = "UPDATE users SET name = 'x' WHERE id = 1";
+    size_t len = strlen(sql);
+    for (auto _ : state) {
+        auto r = parser.parse(sql, len);
+        benchmark::DoNotOptimize(r.stmt_type);
+    }
+}
+BENCHMARK(BM_Classify_Update);
+
+static void BM_Classify_Delete(benchmark::State& state) {
+    Parser<Dialect::MySQL> parser;
+    const char* sql = "DELETE FROM users WHERE id = 1";
+    size_t len = strlen(sql);
+    for (auto _ : state) {
+        auto r = parser.parse(sql, len);
+        benchmark::DoNotOptimize(r.stmt_type);
+    }
+}
+BENCHMARK(BM_Classify_Delete);
+
+static void BM_Classify_Begin(benchmark::State& state) {
+    Parser<Dialect::MySQL> parser;
+    const char* sql = "BEGIN";
+    size_t len = strlen(sql);
+    for (auto _ : state) {
+        auto r = parser.parse(sql, len);
+        benchmark::DoNotOptimize(r.stmt_type);
+    }
+}
+BENCHMARK(BM_Classify_Begin);
+
+// ========== Tier 1: SET parse ==========
+// Target: <300ns
+
+static void BM_Set_Simple(benchmark::State& state) {
+    Parser<Dialect::MySQL> parser;
+    const char* sql = "SET @@session.wait_timeout = 600";
+    size_t len = strlen(sql);
+    for (auto _ : state) {
+        auto r = parser.parse(sql, len);
+        benchmark::DoNotOptimize(r.ast);
+    }
+}
+BENCHMARK(BM_Set_Simple);
+
+static void BM_Set_Names(benchmark::State& state) {
+    Parser<Dialect::MySQL> parser;
+    const char* sql = "SET NAMES utf8mb4 COLLATE utf8mb4_unicode_ci";
+    size_t len = strlen(sql);
+    for (auto _ : state) {
+        auto r = parser.parse(sql, len);
+        benchmark::DoNotOptimize(r.ast);
+    }
+}
+BENCHMARK(BM_Set_Names);
+
+static void BM_Set_MultiVar(benchmark::State& state) {
+    Parser<Dialect::MySQL> parser;
+    const char* sql = "SET autocommit = 1, wait_timeout = 28800, sql_mode = 'STRICT_TRANS_TABLES'";
+    size_t len = strlen(sql);
+    for (auto _ : state) {
+        auto r = parser.parse(sql, len);
+        benchmark::DoNotOptimize(r.ast);
+    }
+}
+BENCHMARK(BM_Set_MultiVar);
+
+static void BM_Set_FunctionRHS(benchmark::State& state) {
+    Parser<Dialect::MySQL> parser;
+    const char* sql = "SET sql_mode = CONCAT(@@sql_mode, ',STRICT_TRANS_TABLES')";
+    size_t len = strlen(sql);
+    for (auto _ : state) {
+        auto r = parser.parse(sql, len);
+        benchmark::DoNotOptimize(r.ast);
+    }
+}
+BENCHMARK(BM_Set_FunctionRHS);
+
+// ========== Tier 1: SELECT parse ==========
+// Target: <500ns simple, <2us complex
+
+static void BM_Select_Simple(benchmark::State& state) {
+    Parser<Dialect::MySQL> parser;
+    const char* sql = "SELECT col FROM t WHERE id = 1";
+    size_t len = strlen(sql);
+    for (auto _ : state) {
+        auto r = parser.parse(sql, len);
+        benchmark::DoNotOptimize(r.ast);
+    }
+}
+BENCHMARK(BM_Select_Simple);
+
+static void BM_Select_MultiColumn(benchmark::State& state) {
+    Parser<Dialect::MySQL> parser;
+    const char* sql = "SELECT id, name, email, status FROM users WHERE active = 1 ORDER BY name LIMIT 100";
+    size_t len = strlen(sql);
+    for (auto _ : state) {
+        auto r = parser.parse(sql, len);
+        benchmark::DoNotOptimize(r.ast);
+    }
+}
+BENCHMARK(BM_Select_MultiColumn);
+
+static void BM_Select_Join(benchmark::State& state) {
+    Parser<Dialect::MySQL> parser;
+    const char* sql = "SELECT u.id, o.total FROM users u JOIN orders o ON u.id = o.user_id WHERE o.status = 'active'";
+    size_t len = strlen(sql);
+    for (auto _ : state) {
+        auto r = parser.parse(sql, len);
+        benchmark::DoNotOptimize(r.ast);
+    }
+}
+BENCHMARK(BM_Select_Join);
+
+static void BM_Select_Complex(benchmark::State& state) {
+    Parser<Dialect::MySQL> parser;
+    const char* sql =
+        "SELECT u.id, u.name, COUNT(o.id) AS order_count "
+        "FROM users u "
+        "LEFT JOIN orders o ON u.id = o.user_id "
+        "WHERE u.status = 'active' AND u.created_at > '2024-01-01' "
+        "GROUP BY u.id, u.name "
+        "HAVING COUNT(o.id) > 5 "
+        "ORDER BY order_count DESC "
+        "LIMIT 50 OFFSET 10";
+    size_t len = strlen(sql);
+    for (auto _ : state) {
+        auto r = parser.parse(sql, len);
+        benchmark::DoNotOptimize(r.ast);
+    }
+}
+BENCHMARK(BM_Select_Complex);
+
+static void BM_Select_MultiJoin(benchmark::State& state) {
+    Parser<Dialect::MySQL> parser;
+    const char* sql =
+        "SELECT a.id, b.name, c.value, d.total "
+        "FROM t1 a "
+        "JOIN t2 b ON a.id = b.a_id "
+        "LEFT JOIN t3 c ON b.id = c.b_id "
+        "JOIN t4 d ON c.id = d.c_id "
+        "WHERE a.status = 1 AND d.total > 100 "
+        "ORDER BY d.total DESC "
+        "LIMIT 20";
+    size_t len = strlen(sql);
+    for (auto _ : state) {
+        auto r = parser.parse(sql, len);
+        benchmark::DoNotOptimize(r.ast);
+    }
+}
+BENCHMARK(BM_Select_MultiJoin);
+
+// ========== Query Reconstruction (round-trip) ==========
+// Target: <500ns
+
+static void BM_Emit_SetSimple(benchmark::State& state) {
+    Parser<Dialect::MySQL> parser;
+    const char* sql = "SET autocommit = 1";
+    size_t len = strlen(sql);
+    for (auto _ : state) {
+        auto r = parser.parse(sql, len);
+        Emitter<Dialect::MySQL> emitter(parser.arena());
+        emitter.emit(r.ast);
+        benchmark::DoNotOptimize(emitter.result());
+    }
+}
+BENCHMARK(BM_Emit_SetSimple);
+
+static void BM_Emit_SelectSimple(benchmark::State& state) {
+    Parser<Dialect::MySQL> parser;
+    const char* sql = "SELECT * FROM users WHERE id = 1";
+    size_t len = strlen(sql);
+    for (auto _ : state) {
+        auto r = parser.parse(sql, len);
+        Emitter<Dialect::MySQL> emitter(parser.arena());
+        emitter.emit(r.ast);
+        benchmark::DoNotOptimize(emitter.result());
+    }
+}
+BENCHMARK(BM_Emit_SelectSimple);
+
+// ========== Arena reset ==========
+// Target: <10ns
+
+static void BM_ArenaReset(benchmark::State& state) {
+    Arena arena(65536);
+    for (auto _ : state) {
+        arena.allocate(256);  // allocate something
+        arena.reset();
+        benchmark::DoNotOptimize(arena.bytes_used());
+    }
+}
+BENCHMARK(BM_ArenaReset);
+
+// ========== PostgreSQL ==========
+
+static void BM_PgSQL_Select_Simple(benchmark::State& state) {
+    Parser<Dialect::PostgreSQL> parser;
+    const char* sql = "SELECT col FROM t WHERE id = 1";
+    size_t len = strlen(sql);
+    for (auto _ : state) {
+        auto r = parser.parse(sql, len);
+        benchmark::DoNotOptimize(r.ast);
+    }
+}
+BENCHMARK(BM_PgSQL_Select_Simple);
+
+static void BM_PgSQL_Set_Simple(benchmark::State& state) {
+    Parser<Dialect::PostgreSQL> parser;
+    const char* sql = "SET work_mem = '256MB'";
+    size_t len = strlen(sql);
+    for (auto _ : state) {
+        auto r = parser.parse(sql, len);
+        benchmark::DoNotOptimize(r.ast);
+    }
+}
+BENCHMARK(BM_PgSQL_Set_Simple);
Original file line number	Diff line number	Diff line change
		@@ -0,0 +1,3 @@
		#include <benchmark/benchmark.h>

		BENCHMARK_MAIN();