kết quả từ 1 tới 8 trên 8

Lấy nội dung trong một chuỗi tìm được trong file pdf

  1. #1
    Ðến Từ
    TP. Hồ Chí Minh
    Thành Viên Thứ: 370242
    Giới tính: Nam
    Bài gửi
    20
    Quick reply to this message Trả lời       

  2. #2
    Ðến Từ
    Đà Nẵng
    Thành Viên Thứ: 361750
    Giới tính: Nam
    Bài gửi
    2.211

    Reply: Lấy nội dung trong một chuỗi tìm được trong file pdf

    vấn đề đầu tiên là làm sao đọc được file pdf đã. pdf có nhiều dạng, dạng text có, dạng image cũng có. mà là image thì bắt đầu khó rồi
    "Above the best
    improve yourself
    your spirit never die..."


  3. Đã cảm ơn snowolf901:


  4. #3
    Ðến Từ
    Yên Bái
    Thành Viên Thứ: 235356
    Giới tính: Nam
    Bài gửi
    746

    Reply: Lấy nội dung trong một chuỗi tìm được trong file pdf

    read file
    Mã:
    using iTextSharp.text.pdf;using iTextSharp.text.pdf.parser;
    
    
    PdfReader reader = new PdfReader(@"D:\test pdf\Blood Journal.pdf");
    int intPageNum = reader.NumberOfPages;
    string[] words;
    string line;
    
    
        for (int i = 1; i <= intPageNum; i++)
        {
            text = PdfTextExtractor.GetTextFromPage(reader, i, new LocationTextExtractionStrategy());
    
    
            words = text.Split('\n');
            for (int j = 0, len = words.Length; j < len; j++)
            {
                line = Encoding.UTF8.GetString(Encoding.UTF8.GetBytes(words[j]));
            }
        }
    khi có được chuỗi
    Số thứ tự: 1,CMND: 312210888
    Mã:
                string input = "Số thứ tự: 1,CMND: 312210888";            string stt = input.Split(',')[0].Split(':')[1];
                string cmnd = input.Split(',')[1].Split(':')[1];
    class TapLamHacker{ private String TráiTim;
    private void Set_TráiTim(String Gái){ this.TráiTim = "Thanh Trâm"; }
    public String Get_TráiTim(){ return "Thanh Trâm"; }
    public String ToString(){return"My love is Thanh Trâm For one future go shopping not concerned about price ";}
    } Liên hệ Skype: Taplamhacker

  5. Đã cảm ơn taplamhacker:


  6. #4
    Ðến Từ
    TP. Hồ Chí Minh
    Thành Viên Thứ: 370242
    Giới tính: Nam
    Bài gửi
    20

    Reply: Lấy nội dung trong một chuỗi tìm được trong file pdf

    Code như thế này thì duyệt từng dòng và lấy dữ liệu cả dòng ra. Ví dụ nếu trong dòng có nội dung như này: Người dùng này có Số thứ tự: 1,CMND: 312210888 và nguyên quán: Bến Tre.
    Vậy mình phải làm sao lấy ra được chuỗi:
    Số thứ tự: 1,CMND: 312210888 để lấy được thông tin STT và CMND.

  7. #5
    Ðến Từ
    Yên Bái
    Thành Viên Thứ: 235356
    Giới tính: Nam
    Bài gửi
    746

    Reply: Lấy nội dung trong một chuỗi tìm được trong file pdf

    Trích Nguyên văn bởi trungbn2010 Xem bài viết
    Code như thế này thì duyệt từng dòng và lấy dữ liệu cả dòng ra. Ví dụ nếu trong dòng có nội dung như này: Người dùng này có Số thứ tự: 1,CMND: 312210888 và nguyên quán: Bến Tre.
    Vậy mình phải làm sao lấy ra được chuỗi:
    Số thứ tự: 1,CMND: 312210888 để lấy được thông tin STT và CMND.
    dùng regular expression nhé bạn
    mình nghĩ bạn nên bổ sung kiến thức căn bảng trước khi làm những bài phức tạp như thế này, để tránh copy code paste xong k đọng lại được chút gì về cái mình vừa làm

  8. Đã cảm ơn taplamhacker:


  9. #6
    Ðến Từ
    Hà Nội
    Thành Viên Thứ: 146858
    Giới tính: Nam
    Bài gửi
    8.059

    Reply: Lấy nội dung trong một chuỗi tìm được trong file pdf

    Trích Nguyên văn bởi taplamhacker Xem bài viết
    dùng regular expression nhé bạn
    mình nghĩ bạn nên bổ sung kiến thức căn bảng trước khi làm những bài phức tạp như thế này, để tránh copy code paste xong k đọng lại được chút gì về cái mình vừa làm
    Có bạn là cao thủ trong lĩnh vực này rồi, thì lần sau mình cứ hỏi tiếp nhé
    Hãy nhấn nút Thank nếu thấy bài viết hữu ích
    Bộ sưu tập cực khủng

  10. Đã cảm ơn quanltv:


  11. #7
    Ðến Từ
    Yên Bái
    Thành Viên Thứ: 235356
    Giới tính: Nam
    Bài gửi
    746

    Reply: Lấy nội dung trong một chuỗi tìm được trong file pdf

    Trích Nguyên văn bởi quanltv Xem bài viết
    Có bạn là cao thủ trong lĩnh vực này rồi, thì lần sau mình cứ hỏi tiếp nhé
    Anh mà hỏi là e tính phí điểm fs

  12. #8
    Ðến Từ
    Đồng Nai
    Thành Viên Thứ: 451742
    Bài gửi
    1

    Reply: Lấy nội dung trong một chuỗi tìm được trong file pdf

    Em xin chào các anh chị vforum.vn,
    Em là 1 dân kế toán không biết gì về lập trình, em tìm mãi mới thấy chủ đề mà em đang rất cần cho công việc.
    Em xin nhờ anh @taplamhacker giúp đỡ em với ạ.

    Em có 1 hóa đơn điện tử dưới dạng file .pdf và em cần lấy nội dung trong chuỗi tìm được trong file pdf đó là: mã số thuế và số hóa đơn để tự động đặt tên file pdf đó theo cấu trúc: "mã số thuế-số hóa đơn".
    Vì 1 tháng hiện nay em có hàng ngàn hóa đơn điện tử để tải về và lưu. nhưng theo phương pháo thủ công hiện nay em phải mở vô từng hóa đơn điện tử để xem mã số thuế và số hóa đơn rồi đặt tên cho chúng.

    Em xin nhờ anh hướng dẫn 1 cách cơ bản từ đầu đến cuối vì em không biết gì về lập trình.

    Em xin chân thành cám ơn anh và các anh chị quan tâm đến em.

    Trân trọng./.