mirror of
https://github.com/bspeice/dtparse
synced 2024-11-13 17:38:09 -05:00
Add the _ymd class
Worst of it is yet to come
This commit is contained in:
parent
5beff61366
commit
184dd9f25c
303
src/lib.rs
303
src/lib.rs
@ -7,8 +7,27 @@ use std::vec::Vec;
|
|||||||
|
|
||||||
#[cfg(test)]
|
#[cfg(test)]
|
||||||
mod test_python_compat;
|
mod test_python_compat;
|
||||||
|
#[cfg(test)]
|
||||||
|
mod tests;
|
||||||
|
|
||||||
#[derive(PartialEq, Debug)]
|
#[derive(Debug, PartialEq)]
|
||||||
|
pub enum ParseError {
|
||||||
|
InvalidMonth,
|
||||||
|
}
|
||||||
|
|
||||||
|
enum ParseInternalError {
|
||||||
|
// Errors that indicate internal bugs
|
||||||
|
YMDEarlyResolve,
|
||||||
|
YMDValueUnset,
|
||||||
|
|
||||||
|
// Python-style errors
|
||||||
|
ValueError(String),
|
||||||
|
}
|
||||||
|
|
||||||
|
type ParseResult<I> = Result<I, ParseError>;
|
||||||
|
type ParseIResult<I> = Result<I, ParseInternalError>;
|
||||||
|
|
||||||
|
#[derive(Debug, PartialEq)]
|
||||||
pub enum Token {
|
pub enum Token {
|
||||||
Alpha(String),
|
Alpha(String),
|
||||||
Numeric(String),
|
Numeric(String),
|
||||||
@ -253,18 +272,18 @@ struct ParserInfo {
|
|||||||
century: u32,
|
century: u32,
|
||||||
}
|
}
|
||||||
|
|
||||||
|
|
||||||
impl Default for ParserInfo {
|
impl Default for ParserInfo {
|
||||||
fn default() -> Self {
|
fn default() -> Self {
|
||||||
let year = Local::now().year();
|
let year = Local::now().year();
|
||||||
let century = year / 100 * 100;
|
let century = year / 100 * 100;
|
||||||
|
|
||||||
ParserInfo {
|
ParserInfo {
|
||||||
jump: parse_info(vec![vec![
|
jump: parse_info(vec![
|
||||||
" ", ".", ",", ";", "-", "/", "'",
|
vec![
|
||||||
"at", "on", "and", "ad", "m", "t", "of",
|
" ", ".", ",", ";", "-", "/", "'", "at", "on", "and", "ad", "m", "t", "of",
|
||||||
"st", "nd", "rd", "th"
|
"st", "nd", "rd", "th",
|
||||||
]]),
|
],
|
||||||
|
]),
|
||||||
weekday: parse_info(vec![
|
weekday: parse_info(vec![
|
||||||
vec!["Mon", "Monday"],
|
vec!["Mon", "Monday"],
|
||||||
vec!["Tue", "Tues", "Tuesday"],
|
vec!["Tue", "Tues", "Tuesday"],
|
||||||
@ -293,13 +312,8 @@ impl Default for ParserInfo {
|
|||||||
vec!["m", "minute", "minutes"],
|
vec!["m", "minute", "minutes"],
|
||||||
vec!["s", "second", "seconds"],
|
vec!["s", "second", "seconds"],
|
||||||
]),
|
]),
|
||||||
ampm: parse_info(vec![
|
ampm: parse_info(vec![vec!["am", "a"], vec!["pm", "p"]]),
|
||||||
vec!["am", "a"],
|
utczone: parse_info(vec![vec!["UTC", "GMT", "Z"]]),
|
||||||
vec!["pm", "p"],
|
|
||||||
]),
|
|
||||||
utczone: parse_info(vec![vec![
|
|
||||||
"UTC", "GMT", "Z"
|
|
||||||
]]),
|
|
||||||
pertain: parse_info(vec![vec!["of"]]),
|
pertain: parse_info(vec![vec!["of"]]),
|
||||||
tzoffset: parse_info(vec![vec![]]),
|
tzoffset: parse_info(vec![vec![]]),
|
||||||
dayfirst: false,
|
dayfirst: false,
|
||||||
@ -361,4 +375,263 @@ impl ParserInfo {
|
|||||||
|
|
||||||
year
|
year
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
|
fn days_in_month(year: i32, month: i32) -> Result<i32, ParseError> {
|
||||||
|
let leap_year = match year % 4 {
|
||||||
|
0 => year % 400 == 0,
|
||||||
|
_ => false,
|
||||||
|
};
|
||||||
|
|
||||||
|
match month {
|
||||||
|
2 => if leap_year {
|
||||||
|
Ok(29)
|
||||||
|
} else {
|
||||||
|
Ok(28)
|
||||||
|
},
|
||||||
|
1 | 3 | 5 | 7 | 8 | 10 | 12 => Ok(31),
|
||||||
|
4 | 6 | 9 | 11 => Ok(30),
|
||||||
|
_ => Err(ParseError::InvalidMonth),
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
#[derive(Debug, Hash, PartialEq, Eq)]
|
||||||
|
enum YMDLabel {
|
||||||
|
Year,
|
||||||
|
Month,
|
||||||
|
Day,
|
||||||
|
}
|
||||||
|
|
||||||
|
struct YMD {
|
||||||
|
_ymd: Vec<i32>, // TODO: This seems like a super weird way to store things
|
||||||
|
century_specified: bool,
|
||||||
|
dstridx: Option<usize>,
|
||||||
|
mstridx: Option<usize>,
|
||||||
|
ystridx: Option<usize>,
|
||||||
|
}
|
||||||
|
|
||||||
|
impl YMD {
|
||||||
|
fn could_be_day(&self, val: i32) -> ParseResult<bool> {
|
||||||
|
if self.dstridx.is_some() {
|
||||||
|
Ok(false)
|
||||||
|
} else if self.mstridx.is_none() {
|
||||||
|
Ok((1 <= val) && (val <= 31))
|
||||||
|
} else if self.ystridx.is_none() {
|
||||||
|
// UNWRAP: mstridx guaranteed to have a value
|
||||||
|
// TODO: Justify unwrap for self._ymd
|
||||||
|
let month = self._ymd[self.mstridx.unwrap()];
|
||||||
|
Ok(1 <= val && (val <= days_in_month(2000, month)?))
|
||||||
|
} else {
|
||||||
|
let month = self._ymd[self.mstridx.unwrap()];
|
||||||
|
let year = self._ymd[self.ystridx.unwrap()];
|
||||||
|
Ok(1 <= val && (val <= days_in_month(year, month)?))
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
fn append(&mut self, val: i32, label: Option<YMDLabel>) -> ParseIResult<()> {
|
||||||
|
let mut label = label;
|
||||||
|
|
||||||
|
if val > 100 {
|
||||||
|
self.century_specified = true;
|
||||||
|
match label {
|
||||||
|
None => label = Some(YMDLabel::Year),
|
||||||
|
Some(YMDLabel::Year) => (),
|
||||||
|
_ => {
|
||||||
|
return Err(ParseInternalError::ValueError(format!(
|
||||||
|
"Invalid label: {:?}",
|
||||||
|
label
|
||||||
|
)))
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
match label {
|
||||||
|
Some(YMDLabel::Month) => {
|
||||||
|
if self.mstridx.is_some() {
|
||||||
|
Err(ParseInternalError::ValueError(
|
||||||
|
"Month already set.".to_owned(),
|
||||||
|
))
|
||||||
|
} else {
|
||||||
|
self.mstridx = Some(self._ymd.len() - 1);
|
||||||
|
Ok(())
|
||||||
|
}
|
||||||
|
}
|
||||||
|
Some(YMDLabel::Day) => {
|
||||||
|
if self.dstridx.is_some() {
|
||||||
|
Err(ParseInternalError::ValueError(
|
||||||
|
"Day already set.".to_owned(),
|
||||||
|
))
|
||||||
|
} else {
|
||||||
|
self.dstridx = Some(self._ymd.len() - 1);
|
||||||
|
Ok(())
|
||||||
|
}
|
||||||
|
}
|
||||||
|
Some(YMDLabel::Year) => {
|
||||||
|
if self.ystridx.is_some() {
|
||||||
|
Err(ParseInternalError::ValueError(
|
||||||
|
"Year already set.".to_owned(),
|
||||||
|
))
|
||||||
|
} else {
|
||||||
|
self.ystridx = Some(self._ymd.len() - 1);
|
||||||
|
Ok(())
|
||||||
|
}
|
||||||
|
}
|
||||||
|
None => Err(ParseInternalError::ValueError("Missing label.".to_owned())),
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
fn resolve_from_stridxs(
|
||||||
|
&mut self,
|
||||||
|
strids: &mut HashMap<YMDLabel, usize>,
|
||||||
|
) -> ParseIResult<(i32, i32, i32)> {
|
||||||
|
if strids.len() == 2 {
|
||||||
|
let missing_key = if !strids.contains_key(&YMDLabel::Year) {
|
||||||
|
YMDLabel::Year
|
||||||
|
} else if !strids.contains_key(&YMDLabel::Month) {
|
||||||
|
YMDLabel::Month
|
||||||
|
} else {
|
||||||
|
YMDLabel::Day
|
||||||
|
};
|
||||||
|
|
||||||
|
let strids_vals: Vec<usize> = strids.values().map(|u| u.clone()).collect();
|
||||||
|
let missing_val = if !strids_vals.contains(&0) {
|
||||||
|
0
|
||||||
|
} else if !strids_vals.contains(&1) {
|
||||||
|
1
|
||||||
|
} else {
|
||||||
|
2
|
||||||
|
};
|
||||||
|
|
||||||
|
strids.insert(missing_key, missing_val);
|
||||||
|
}
|
||||||
|
|
||||||
|
if self._ymd.len() != 3 || strids.len() != 3 {
|
||||||
|
return Err(ParseInternalError::YMDEarlyResolve);
|
||||||
|
}
|
||||||
|
|
||||||
|
// TODO: Why do I have to clone &usize? Isn't it Copy?
|
||||||
|
Ok((
|
||||||
|
self._ymd[strids.get(&YMDLabel::Year).unwrap().clone()],
|
||||||
|
self._ymd[strids.get(&YMDLabel::Month).unwrap().clone()],
|
||||||
|
self._ymd[strids.get(&YMDLabel::Day).unwrap().clone()],
|
||||||
|
))
|
||||||
|
}
|
||||||
|
|
||||||
|
fn resolve_ymd(&mut self, yearfirst: bool, dayfirst: bool) -> ParseIResult<(i32, i32, i32)> {
|
||||||
|
let len_ymd = self._ymd.len();
|
||||||
|
let mut year: Option<i32> = None;
|
||||||
|
let mut month: Option<i32> = None;
|
||||||
|
let mut day: Option<i32> = None;
|
||||||
|
let mut other: Option<i32> = None;
|
||||||
|
|
||||||
|
let mut strids: HashMap<YMDLabel, usize> = HashMap::new();
|
||||||
|
self.ystridx
|
||||||
|
.map(|u| strids.insert(YMDLabel::Year, u.clone()));
|
||||||
|
self.mstridx
|
||||||
|
.map(|u| strids.insert(YMDLabel::Month, u.clone()));
|
||||||
|
self.dstridx
|
||||||
|
.map(|u| strids.insert(YMDLabel::Day, u.clone()));
|
||||||
|
|
||||||
|
// TODO: More Rustiomatic way of doing this?
|
||||||
|
if let Ok(ymd) = self.resolve_from_stridxs(&mut strids) { return Ok(ymd) };
|
||||||
|
|
||||||
|
// TODO: More Rustiomatic? Too many blocks for my liking
|
||||||
|
// Also having the array unpacking syntax is nice
|
||||||
|
if len_ymd > 3 {
|
||||||
|
return Err(ParseInternalError::ValueError(
|
||||||
|
"More than three YMD values".to_owned(),
|
||||||
|
));
|
||||||
|
} else if len_ymd == 1 || (self.mstridx.is_some() && len_ymd == 2) {
|
||||||
|
if self.mstridx.is_some() {
|
||||||
|
month = Some(self._ymd[self.mstridx.unwrap()]);
|
||||||
|
other = Some(self._ymd[self.mstridx.unwrap() - 1]);
|
||||||
|
} else {
|
||||||
|
other = Some(self._ymd[0]);
|
||||||
|
}
|
||||||
|
|
||||||
|
if len_ymd > 1 || self.mstridx.is_some() {
|
||||||
|
if other.unwrap_or(0) > 31 {
|
||||||
|
year = other;
|
||||||
|
} else {
|
||||||
|
day = other;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
} else if len_ymd == 2 {
|
||||||
|
if self._ymd[0] > 31 {
|
||||||
|
year = Some(self._ymd[0]);
|
||||||
|
month = Some(self._ymd[1]);
|
||||||
|
} else if self._ymd[1] > 31 {
|
||||||
|
month = Some(self._ymd[0]);
|
||||||
|
year = Some(self._ymd[1]);
|
||||||
|
} else if dayfirst && self._ymd[1] <= 12 {
|
||||||
|
day = Some(self._ymd[0]);
|
||||||
|
month = Some(self._ymd[1]);
|
||||||
|
} else {
|
||||||
|
month = Some(self._ymd[0]);
|
||||||
|
day = Some(self._ymd[1]);
|
||||||
|
}
|
||||||
|
} else if len_ymd == 3 {
|
||||||
|
// UNWRAP: 3 elements guarantees all indices are Some
|
||||||
|
if self.mstridx.unwrap() == 0 {
|
||||||
|
if self._ymd[1] > 31 {
|
||||||
|
month = Some(self._ymd[0]);
|
||||||
|
year = Some(self._ymd[1]);
|
||||||
|
day = Some(self._ymd[2]);
|
||||||
|
} else {
|
||||||
|
month = Some(self._ymd[0]);
|
||||||
|
day = Some(self._ymd[1]);
|
||||||
|
year = Some(self._ymd[2]);
|
||||||
|
}
|
||||||
|
} else if self.mstridx.unwrap() == 1 {
|
||||||
|
if self._ymd[0] > 31 || (yearfirst && self._ymd[2] <= 31) {
|
||||||
|
year = Some(self._ymd[0]);
|
||||||
|
month = Some(self._ymd[1]);
|
||||||
|
day = Some(self._ymd[2]);
|
||||||
|
} else {
|
||||||
|
day = Some(self._ymd[0]);
|
||||||
|
month = Some(self._ymd[1]);
|
||||||
|
year = Some(self._ymd[2]);
|
||||||
|
}
|
||||||
|
} else if self.mstridx.unwrap() == 2 {
|
||||||
|
// It was in the original docs, so: WTF!?
|
||||||
|
if self._ymd[1] > 31 {
|
||||||
|
day = Some(self._ymd[0]);
|
||||||
|
year = Some(self._ymd[1]);
|
||||||
|
month = Some(self._ymd[2]);
|
||||||
|
} else {
|
||||||
|
year = Some(self._ymd[0]);
|
||||||
|
day = Some(self._ymd[1]);
|
||||||
|
month = Some(self._ymd[2]);
|
||||||
|
}
|
||||||
|
} else {
|
||||||
|
if self._ymd[0] > 31 || self.ystridx.unwrap() == 0 ||
|
||||||
|
(yearfirst && self._ymd[1] <= 12 && self._ymd[2] <= 31) {
|
||||||
|
if dayfirst && self._ymd[2] <= 12 {
|
||||||
|
year = Some(self._ymd[0]);
|
||||||
|
day = Some(self._ymd[1]);
|
||||||
|
month = Some(self._ymd[2]);
|
||||||
|
} else {
|
||||||
|
year = Some(self._ymd[0]);
|
||||||
|
month = Some(self._ymd[1]);
|
||||||
|
day = Some(self._ymd[2]);
|
||||||
|
}
|
||||||
|
} else if self._ymd[0] > 12 ||
|
||||||
|
(dayfirst && self._ymd[1] <= 12) {
|
||||||
|
day = Some(self._ymd[0]);
|
||||||
|
month = Some(self._ymd[1]);
|
||||||
|
year = Some(self._ymd[2]);
|
||||||
|
} else {
|
||||||
|
month = Some(self._ymd[0]);
|
||||||
|
day = Some(self._ymd[1]);
|
||||||
|
year = Some(self._ymd[2]);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
if !year.and(month).and(day).is_some() {
|
||||||
|
Err(ParseInternalError::YMDValueUnset)
|
||||||
|
} else {
|
||||||
|
Ok((year.unwrap(), month.unwrap(), day.unwrap()))
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
11
src/tests.rs
Normal file
11
src/tests.rs
Normal file
@ -0,0 +1,11 @@
|
|||||||
|
use ParseError;
|
||||||
|
use days_in_month;
|
||||||
|
|
||||||
|
#[test]
|
||||||
|
fn test_num_days_in_month() {
|
||||||
|
assert_eq!(days_in_month(2000, 12), Ok(31));
|
||||||
|
assert_eq!(days_in_month(2000, 2), Ok(29));
|
||||||
|
assert_eq!(days_in_month(2000, 4), Ok(30));
|
||||||
|
assert_eq!(days_in_month(2001, 2), Ok(28));
|
||||||
|
assert_eq!(days_in_month(2000, 13), Err(ParseError::InvalidMonth))
|
||||||
|
}
|
Loading…
Reference in New Issue
Block a user